今天就把东盟十国的地图做出来

国内卷不动了,走出去谋出路、找商机,势必是未来五年、十年,乃至几十年的创业主题。

很多专家给出的咨询建议,出国发展首选东南亚。这也是大部分企业自觉自动的选项吧——东南亚地理上离我们就挺近,历史承载了泛儒家的文化圈,华人后裔人口比例又相对高,这是东南亚肉眼可见的吸引力所在。

但要是打算真刀真枪去投资了,你说到底是河内好,还是雅加达更优先?马尼拉怎么就不行呢?凭想象肯定不够。别说把东盟十国的首都都标识在地图上,还要清楚的指出哪个首都的人口最多,就是聊个天,说说吉隆坡在新加坡的南边还是北边,不关注东南亚的人恐怕还真是不敢肯定。

这些都是小事儿,领导要问起来,回答这些问题,这个年代了,你可不能说我用一天时间调研一下。应该就是几分钟的效率要求。而且还得是带地图的。

这次我们试试国内风头正劲的与王小川同为清华系大模型年轻的创业者——杨植麟创建的『月之暗面』——moonshot。

Ta家的对话机器人叫做kimi(https://kimi.moonshot.cn/),擅长长文本,中文。我们先从简单的开始。

请用表格的形式将东盟十国的首都及其坐标输出。表格包括五个字段:国家 首都 经度 纬度 最近人口。经度纬度的数据要求是带小数的格式,例如106.8456 -6.2088。注意南纬用负数表示。人口信息可以查询维基百科,尽可能使用最新的人口数据。

用表格输出经纬度,并且对格式上有要求,是为了后续做图的方便。kimi输出的坐标没问题,但人口数据就有点古怪了,别说河内的9700万了,雅加达都2.73亿!显然kimi将我的指令理解为国家人口了,当然,我的提问也是有歧义。这对于与大模型交流的你我来说,语言精确是必须要做到的。

kimi很严谨,在我指出来Ta的理解有误以后,给出来新的数据,但仍然强调是估计的数值。因为在Ta刚才的回答中已经明确说了无法访问维基百科,那我还是寻求一下海外机器人的帮助。

谷歌的搜索强,那就上gemini(谷歌的最强模型——双子座。访问bard的原地址,现在已经自动变成了https://gemini.google.com/app/)。

同样的问题,gemini一次性搞定了,可以输出为谷歌的表格,当然就可以另存为CSV或者Excel的格式了。gemini还给出了参考信息来源。虽然查一下这些首都城市的维基页面,发现也有具体数值上的出入,但出入很小,不影响宏观上的判断比较。

有了表格,就可以生成地图了。用QGIS也好,还是用python写的代码,或者用极海的免费工具(https://geohey.com/app/dataviz/#/)上图,都可以。

在线访问东盟首都人口地图

根据人口配置一下首都原点的大小,截图或者生成在线地图的链接。这一套操作下来,没有什么卡点。文章看到这里,你要不要试试?

在QGIS中绘制,截图,也方便

我们极海的小伙伴青健老师,做的就更讲究一点,配色,标注,图例,指北针等一应俱全。他是专业的,就要有专业的气质。

当然,青健积累的丰富的数据也可以做更多细致的工作。

极海的全球地理数据库中,东南亚部分也是重要的组成

数据的积累需要长期的工程化投入,这是企业的事情。对于个人的临时性工作,AI带来的收益,在效率上的提升,这种显著性是我们最最看重的,尤其是AI辅助我们的操作,往往枯燥而重复,这部分活儿,正是应该『外包』给AI完成。

来一个不算太长的文本,让kimi读一读,看看你想提取的那些要点和数字,kimi是不是擅长。我选了最近出炉的北大汇丰商学院的一份报告《制造业投资东盟首选哪些国家》。

先让kimi做个总结吧,这是大模型最擅长的部分了。

甚好甚好!不过我们的人类大脑喜欢简化。当我看到结论部分:*报告总结了东盟各国的投资环境,并指出新加坡、马来西亚、越南和印度尼西亚在投资环境方面位居前列。*我的大脑很高兴,有结论了:去新加坡,马来西亚,越南,印尼。我们要警惕大模型引发的副作用:人类大脑会越发的变傻。不想变傻又想偷懒,就得上脑机接口了,这些『严重』的问题,将来再说。现在就解决多快好省的干活。

看了这篇报告,先不说结论和解释,我喜欢汇丰智库已经整理出来的数据,但已经做成了PDF和图表。传统上OCR只能识别表格,但能理解饼图柱图,还真得靠我们职场打工人的一点点手抄了。当然,现在的文档工具也都先进了,也期待这些工具很快就能集成大语言模型进行更智能的提取。

在WPS中,调用提取和识别中的『提取表格』。上图中的表格还是很成功的输出了。

个别数字和文字还差点意思,不过很容易补齐。这些数字从PDF中的图片,已经变成你的数据资产。

现在检验kimi智能化的地方来了,让Ta将已经制作成图的数字还原成表格,我先挑选了一个简单一点的饼图:

请识别图片中饼图的数据,用表格的形式输出:

稳稳当当的秒出了。再试试复杂一点的,堆叠柱图:

除了柬埔寨的22.3%,『看成了』223%外,没有一个数字出错。kimi宣传的速度快,此言不虚。想象一下,如果是50根柱子,相比你一个数一个数的抄写,得节省你多少的时间啊。但这里面柱图上必须得标注数字,否则kimi无法给你一个数值,即便是估计的。我测试了一下GPT4,非要让Ta根据柱图的长短进行估计,Ta还真干活。不过,这种估计就不如咱们『人眼』了,可靠性很差。

识别了一堆图表了,打算将其做成一个简单的仪表板,左侧选指标,右侧呈现地图和柱图,柱图从左到右,指标从高到低排列。实现这样的要求,非程序员大概会绕道走了吧。要不也得对Tableau等BI工具比较熟练,否则都不太敢说上午接活,中午出结果。

这是过去,现在不是有kimi这样随时可以帮你干活的助手了吗?交代任务不就行了?

根据这篇文档中的数据,做一个python程序。显示一个可交互的页面。左边是指标选择下拉框。右边上半部分是地图,将东盟十国的行政区划用不同颜色显示,颜色对应指标的高低。下半部分是柱图,要求从左到右,指标从高到低排列。程序框架请用streamlit,图表用plotly

kimi相当可以啊:

但kimi在程序改错方面差点意思,一个小问题,反复都改不对。我只好求助海外助手。GPT4还是惊艳,一下子就识别了kimi的程序错误,顺利改好,做了一些小调整后,比如为了能显示出新加坡,增加了点图,图表的摆放位置调整一下。

程序和图表都很简单,但一篇人家的PDF文档,已经变成了你对东盟十国的数字化表达

正巧,本周号称超越了GPT4的claude3发布了,我也赶快试一试,请claude3的最强模型Opus来写写程序。将GPT4写的python程序用JavaScript实现。

请模拟一个优秀的前端程序员,帮我完成一段代码。先阅读下面代码,将其修改为D3的框架技术,全部用前端绘制,实现类似功能。我的编程工具是vscode,如果需要我安装什么,请指导我完成。我要求最后可以将你修改的代码保存为HTML格式,点击该文件即可以在浏览器上运行,需要你阅读的代码如下,请开始指导我:

看到Claude说当然可以的时候,我的多巴胺就开始溢出了。几乎没有什么大的修改,就是反馈了一点点布局的问题,标签的问题,生成了243行代码,比python的114行代码多了一倍有余。

再让Claude用Echart的库实现一下,这回一来一往交流的次数多了一点。最终出来的效果没问题。在这个过程中,我没有尝试去阅读一句代码,我只是琢磨着怎么将反馈说的清楚,修改要求描述的明晰。

全程操作下来,组合使用了四个大模型,差不多是全球最强搭档的小团队了吧。耗时四个小时。下次再提取PDF文档中的数字,用交互图表输出,相信我会进步一点点,熟练一点点(我估计一个小时以内即可以搞定)。

本文的主旨不在于让你因为有了AI,怎样能变成了一个程序员,一个数据『书呆子』,或者一个GISer。而是将任何你能积累的资料变成数据,用你的形式表达。并且对不熟悉的工具或者技术一点都不为难。

我们每个人都有自己的生活和工作节奏,面对琐碎的日常,时间和精力总是有限。但正是在这些日常中,我们可以尝试一点小小的改变——比如试试用AI提取PDF里的数据,做个简单的可视化。这些小尝试看似微不足道,但日积月累,就能让我们拥有更从容、更高效的状态,腾出时间做更有意义的事情。

我相信,你我都有能力去拥抱变化,学习新技能。这不是什么惊天动地的壮举,而是一个个鲜活的小试验,一次次充满乐趣的小冒险。就像文中展示的例子,用上AI助手后的流程是不是变得有意思多了?这背后是这个时代最最前沿的科技进步,更是我们与时俱进的心。

我在极海的公号文章中,一直在邀请大家去拥抱AI带来的种种可能。不必着急,也不必焦虑,只是怀着好奇和开放的心,去发现和创造属于自己的"AI时刻"。