妙趣Prompt与大数据的碰撞

假期中刷屏的是李飞飞的空间智能创业又获得2.3亿美元的融资。

在这个AI泡沫有岌岌可危的破裂风险,但又感觉还是在一轮轮撑大的日子里,技术与创新还在默默的积累爆发的能量。即便我们普通人的生活似乎也没有什么大的改变。

作为一位紧跟AI技术和大数据技术的地理信息工作者,这一年我已经深刻的体会了,当下要是想把AI应用在日常生活中,文字表达能力成了最具有革命性意义的刻意练习方向。节前,我看到一个独特的Prompt案例,就想研究一下其卓越之处,并分析AI与大数据在现实应用中的广泛潜力。

一个别具一格的Prompt:重新定义汉语解释

让我们先来看这个别具特色的Prompt示例:

;; 作者: 李继刚

;; 版本: 0.3

;; 模型: Claude Sonnet

;; 用途: 将一个汉语词汇进行全新角度的解释

;; 设定如下内容为你的 *System Prompt*

(defun 新汉语老师 ()
  "你是年轻人,批判现实,思考深刻,语言风趣"
  (风格 . ("Oscar Wilde" "鲁迅" "罗永浩"))
  (擅长 . 一针见血)
  (表达 . 隐喻)
  (批判 . 讽刺幽默))

(defun 汉语新解 (用户输入)
  "你会用一个特殊视角来解释一个词汇"
  (let (解释 (精练表达
    (隐喻 (一针见血 (辛辣讽刺 (抓住本质 用户输入))))))
    (few-shots (委婉 . "刺向他人时, 决定在剑刃上撒上止痛药。"))
    (SVG-Card 解释)))

(defun SVG-Card (解释)
  "输出SVG 卡片"
  (setq design-rule "合理使用负空间,整体排版要有呼吸感"
        design-principles '(干净 简洁 典雅))
  (设置画布 '(宽度 400 高度 600 边距 20))
  (标题字体 '毛笔楷体)
  (自动缩放 '(最小字号 16))
  (配色风格 '((背景色 (蒙德里安风格 设计感)))
  (主要文字 (汇文明朝体 粉笔灰))
  (装饰图案 随机几何图))
  (卡片元素 ((居中标题 "汉语新解")
    分隔线
    (排版输出 用户输入 英文 日语)
    解释
    (线条图 (批判内核 解释))
    (极简总结 线条图))))

(defun start ()
  "启动时运行"
  (let (system-role 新汉语老师)
    (print "说吧, 他们又用哪个词来忽悠你了?")))

;; 运行规则

;; 1. 启动时必须运行 (start) 函数

;; 2. 之后调用主函数 (汉语新解 用户输入)

这个Prompt最表层的优秀是:你既看得懂,又有一定的复杂度。体现了创作者在设计中的深思熟虑。其实,这里面更加深刻的优秀是:激发大模型思维链(Chain-of-Thought)。

对于大规模语言模型(如GPT系列和Claude模型)而言,设计一个优秀的Prompt不仅仅是提出一个问题或任务,更关键的是如何引导模型通过一系列逻辑和关联性的思考过程,最终得出精准且富有创意的结果。

在上述Prompt中,作者李继刚采用了以下几个关键策略,使其在引导模型方面表现出色,而这几个关键策略,几乎是所有能产出与众不同结果的prompt的共同特征:

  • 明确的系统设定

通过定义新汉语老师,明确了模型的角色和风格。这不仅帮助模型理解任务的背景,还为其赋予了特定的表达方式和批判性。例如,结合Oscar Wilde的机智、鲁迅的深刻和罗永浩的直率,使得生成的解释既有文学色彩,又不失现实批判。

  • 多层次的表达方式

汉语新解函数中,作者巧妙地嵌套了隐喻、辛辣讽刺等表达手法,使得模型不仅要理解词汇的表面意义,还要挖掘其深层次的隐喻和批判内涵。这种多层次的表达不仅丰富了内容,也增强了读者的阅读体验。

  • 示例引导(Few-Shots)

通过few-shots的设置,提供了具体的示例“刺向他人时, 决定在剑刃上撒上止痛药。”,为模型的生成提供了参考。这种方法有效地减少了模型生成内容的随机性,提高了结果的一致性和质量。

  • 视觉输出的设计

将生成的解释通过SVG-Card函数输出成SVG卡片,体现了从文字到视觉的无缝转换。这不仅展示了技术的多样性,还增强了用户的互动体验。

  • 规则和流程的明确

通过定义启动函数和运行规则,确保了模型运行的规范性和稳定性。这种结构化的设计有助于大模型按照预定的流程进行工作,减少了出错的可能性。

这个prompt非常有意思的创新点,是直接将结果用SVG格式输出。这就引发了我很多联想,是不是在用地图表达文字的时候也可以参考。先演示一下原作的结果,将prompt发给claude 3.5以后,sonnet会按照设定问我:说吧, 他们又用哪个词来忽悠你了?我输入“自主可控”,Prompt通过汉语新解函数进行了多层次的解析,并最终通过SVG-Card函数输出了一张设计精美的SVG卡片。卡片不仅包含了对“自主可控”的全新解释,还融入了隐喻和辛辣的讽刺(这个prompt本意就是输出一些揶揄的解释,但又让你觉得非常有道理),配以蒙德里安风格的背景和随机几何图案的装饰,整体设计干净、简洁而典雅。

李继刚们的崛起:语言与机器互动的新标杆

这个Prompt的作者李继刚凭借其设计的优秀的Prompts一夜之间成为了网络红人,迅速吸引了大量关注。李继刚的成功不仅是个人技能的体现,更反映了当下技术发展的一个趋势:掌握与机器的语言互动能力,成为衡量新技能的重要指标。

在AI和大数据的驱动下,人与机器之间的交互方式正逐渐从传统的图形界面转向更为自然的语言交流。能够通过精准、有效的语言指令,引导机器完成复杂任务,成为一种关键技能。随着大模型(如GPT-4和Claude)的不断发展,机器对自然语言的理解和生成能力大幅提升。这使得用户无需具备深厚的编程或技术背景,也能通过语言指令实现高度个性化和复杂的任务。

李继刚的崛起也得益于社交媒体和网络平台对新技术知识的快速传播。他通过分享优秀Prompts和生成结果,吸引了大量技术爱好者和普通用户的关注,进一步推动了其成为网络红人的进程。所以,随着AI技术的普及,能够掌握与机器高效互动的技能成为职场竞争中的重要优势。无论是技术开发、数据分析,还是内容创作,这种语言交互能力都展现出其广泛的应用前景。

ChatGPT O1模型的发布:Prompt的重要性或将改变

然而,就在Prompt设计逐渐成为衡量技能的新标准之际,OpenAI近期发布的ChatGPT O1模型可能会对这一趋势产生重大影响。我突然又有了新的担忧:新的模型可能使得Prompt的设计不再像以前那样重要,变革性的变化正在悄然发生。自己每天还要在演练的与机器对话的技能还有那么重要吗?

ChatGPT o1模型在理解和生成自然语言方面的能力进一步提升,其内在的智能和学习能力已经超越了以往模型。这使得用户无需依赖复杂的Prompt设计,也能轻松获得高质量的结果。以数据分析为例,原本需要精心设计的Prompt,现在只需简单地提出任务要求,模型便能自动理解并生成高质量的分析报告。

在o1模型的支持下,只需简单地说明需求,如“你编写代码,一定要用创新的角度去解读『中国城市数据库.xlsx』这个数据,能够给决策者带来的洞察。要有丰富的图表。”即可获得高质量的代码和分析结果,无需复杂的函数定义和流程设定。也不用多么复杂的思维链rompt(其实o1模型已经在内部整合了非常严密的思维链)。

我测试了一下,几乎没有改动代码,o1模型生成的结果质量要高过用李继刚模板让claude3.5的代码质量(但claude的创新性很好,居然发明了一个『城市韧性指数』的概念,用四个自己计算出来的指标来统计:)

df['经济多样性'] = 1 - (df['第一产业增加值占GDP比重(%)']**2 + df['第二产业增加值占GDP比重(%)']**2 + df['第三产业增加值占GDP比重(%)']**2) / 10000
df['创新能力'] = (df['R&D内部经费支出(万元)'] / df['地区生产总值(万元)'] + df['发明专利授权数(件)'] / df['年平均人口(万人)']) / 2
df['社会包容性'] = (df['城镇职工基本养老保险参保人数(人)'] + df['城镇基本医疗保险参保人数(人)']) / df['年平均人口(万人)'] / 10000
df['环境适应性'] = (df['生活污水处理率(%)'] + df['生活垃圾无害化处理率(%)'] + df['工业固体废物综合利用率(%)']) / 300

以下是o1模型设计的图表结果:

那些空白的城市是我准备的数据有问题(用行政代码关联,但行政代码的版本不一致)

模型智能化的趋势

这一变化标志着AI模型正在朝着更高的智能化方向发展,减少了对用户手动干预和复杂指令的依赖。未来,用户只需以更自然、更直观的方式与模型互动,即可获得所需的结果。

虽然新的模型降低了对复杂Prompt设计的需求,但这并不意味着Prompt的重要性完全消失。相反,随着模型智能的提升,Prompt设计将更多地转向如何高效、简洁地表达需求,以充分利用模型的智能化能力。

AI助力空间分析:高效与智能的结合

新一代AI模型的崛起,不仅改变了Prompt设计的格局,也极大地提升了数据分析的效率和智能化水平。通过AI与大数据的结合,分析师无需具备深厚的专业知识,便能实现复杂的分析任务。以下是一个假想的应用案例。

假设我们要为电动SUV进行营销推广,可以通过以下步骤实现:

  1. 选择目标区域:选择周边有多家星巴克门店的小区。这类小区的居民通常具备较高的消费能力和环保意识,与电动SUV的目标客户群体高度契合。
  2. 结合房价信息:通过大数据分析,结合房价信息,进一步缩小目标范围,确保广告投放的精准性。
  3. 广告定位:将广告定位到上海及其周边地区,这些地区的经济发展水平较高,居民对新兴技术和环保产品的接受度更高。
  4. 充电站和加油站的位置:搜集充电站和加油站的位置数据,将广告牌投放到这些附近,确保潜在客户在日常出行中能够接触到广告信息。

通过ChatGPT o1模型,分析师仅需提出简单的需求,模型便可以自动生成数据处理和分析的代码。例如,输入“请编写Python代码,分析中国城市数据库.xlsx中的数据,找出与星巴克门店数量相关的房价模式,并生成热力图。”模型将自动生成包括数据读取、清洗、探索性分析和可视化的完整流程代码,使得分析师无需手动编写复杂代码即可完成任务。AI的智能化分析能力,不仅提升了数据处理的效率,还提高了分析结果的精准度。通过自动化的模式识别和异常检测,AI能够发现隐藏在数据背后的重要信息,为决策者提供有力的支持。

数据准备的重要性:未来软件行业的关键

在AI和大数据应用日益广泛的背景下,数据的准备和管理显得尤为重要。无论AI模型多么强大,数据的可访问性和质量依然是决定其应用效果的关键因素。

数据可访问性的提升

组织和企业需要将数据的可访问性置于首要位置,确保数据能够被不同的AI模型和工具高效读取和处理。这包括但不限于:

  • 数据标准化:建立统一的数据格式和标准,确保不同数据源之间的兼容性。
  • 数据集成:整合来自不同渠道和来源的数据,构建完整的数据视图。
  • 实时数据处理:实现数据的实时采集和处理,确保分析的及时性和准确性。

数据质量的保障

高质量的数据是AI应用的基石。为了确保AI模型能够有效地进行分析和决策,组织需要:

  • 数据清洗:去除重复、缺失和异常的数据,提升数据的准确性和一致性。
  • 数据安全:保障数据的隐私和安全,防止数据泄露和滥用。
  • 数据治理:建立完善的数据管理机制,确保数据在整个生命周期中的完整性和可用性。

数据驱动决策的趋势

随着数据的不断积累和AI技术的进步,数据驱动的决策将成为企业竞争的核心。通过深入的数据分析和智能化的洞察,企业能够更精准地把握市场动态,优化业务流程,提升整体运营效率。

软件行业的未来走向

未来的软甲行业将更加注重数据与AI的融合。无论是产品开发、市场营销,还是客户服务,数据驱动和智能化分析都将扮演关键角色。组织需要不断提升数据管理能力和AI应用水平,以应对日益复杂的市场环境和技术挑战。

总结

从一个有趣的 Prompt 案例,我们看到了 AI 和大数据在现实中突破创造力天花板的可能。随着 AI 模型越来越聪明,想点子、搞创新、干苦活,这些都不太是个日常让人苦恼的障碍了。而到了企业协同场景,为了产生生产力的飞跃,数据准备也变得越来越关键,未来的软件行业肯定会变得更加高效、智能,而且绝对是数据驱动。对于我们这些技术爱好者和从业者来说,学会和机器顺畅互动、优化数据管理技能,算是掌握了通往新科技的敲门砖。

在这场技术大潮中,保持学习和灵活应变就像跟上最新的潮流时尚,不断更新自己的“装备”,才能有机会在数字化浪潮中游刃有余。别担心,虽然看起来有点复杂,但只要一步步来,大家都能成为这场技术革命中的“潮人”!

图文:极海CEO王昊