条件随机场应用于中文地址切分

条件随机场应用于中文地址切分 一、模型结果 条件随机场简称CRF,常用于标注或分析序列资料,如自然语言文字或是生物序列。条件随机场应用于中文地址切分,就是根据训练样本中文字的上下文关系及标注信息将地址进行切分并将切分后的省市区县等地名进行标注,图1为模型结果展示 图1 /city 更多

jing

GeoHey SDK 3D新特性展望

在大二的时候,课表上多了一个奇怪的课程,计算机图形学。我以为学会这个课程,我就能自己写一个魔兽世界之类的游戏,然后走上人生巅峰,开课的前几天,我还在构思游戏怎么收费可以赚钱,又不至于被喷得太惨。 而然现实很骨感,开课后我才发现,别说游戏,就连画一条直线都有三四种算法,还有各种矩阵 更多

马丁路德金大道与贫困的黑人

知乎之前的热帖,有哪些重复的地名?,引起了热烈的关注。其实不光有重读的地名,大量的路名也是有重复的,比如每个城市都有的中山路等等。今天我们就来看美国一个著名的路名:马丁路德金大道,以及这条路背后的社会故事。 马丁·路德·金博士,是一位美国人民权运动领袖。他主张以非暴力的公民抗命方 更多

就业培训反而有害吗?

考虑这样一个问题: 政府推出了一项就业培训项目,项目的参与者记为“实验组”,未参与者记为“控制组”,如何来估计该就业培训项目对参与者收入的影响? 一个天真的做法是直接对比实验组与控制组的未来收入或就业状况,或者简单以是否参与为虚拟变量,对总体进行回归。 可是这种方法真的对么? 试 更多

baiby

极海数据分析(下):我们在做什么

如果您看过极海数据分析(上):机器在做什么,您就会知道,本文题目中的“我们”,指的是人类大脑——作为数据分析师的我们。 深度学习技术的惊人发展,似乎让数据分析师变得不重要了——它就像一个自动面包机,面粉、水、糖放进去,程序参数设好,我们坐等收获面包就好了。全麦也行、椰香也行,我们 更多

极海数据分析(上):机器在做什么

——如果机器说,能帮人类准确地预测市场,预测价格,却无法告诉我们为什么。我们敢相信吗? 深度学习 是当下数据科学界最火的话题。从这个发展了短短几年的领域,已经诞生出能击败李世石的 AlphaGo,和能在路况最复杂的匹兹堡安全行驶的 无人车。要训练机器完成这样需要人类智能水平的任务 更多

一种酷炫的空间密度可视化方案

帅小伙@sshuair曾经在知乎上回答 有哪些重复的地名问题,除了统计中国农村相同尾字的数量,还做了令人惊艳的分布地图,收获4000多赞。 统计显示,全国村庄中,名字尾字相同数量排在前三的分别是:村、沟、庄。以村结尾的村庄,分布在全国各地,没有明显规律;以沟结尾的村庄,多分布在秦 更多