传统软件行业要是终结了,什么会崛起?

三月份的时候,我看了一场刀哥(得到联创 快刀青衣)和有赞创始人 白鸦的一场直播。当时听到白鸦说有赞微商城SaaS的后台功能有6000多个,着实被吓了一跳。SaaS既要标准化又要满足个性化的需求,确实是个难题。6000个功能,该怎么摆布?

有赞已经用上了AI去改善用户体验,用户可以唤起智能助手,用对话的方式一键定位功能按钮。虽然这个方案并没有用到将AGI的G(generative,生成)足够体现出来,但对于SaaS软件来说,已经是非常棒的尝试了。

传统软件将走向终结

前两天看到瑞典的金融科技公司 Klarna的CEO决定逐步弃用 Salesforce 和 Workday 等知名 SaaS 产品,转而依靠 AI 技术快速自己开发需要的办公软件并将其自动化。Sebastian Siemiatkowski 在一次会议中解释道,公司的目标是通过 AI 和标准化来关闭更多的外部 SaaS 服务商。如果Klarna的选择成为一种趋势,那现如今,可就不用再操心什么SaaS软件的定制难题了,而且对于软件行业当今真是一场巨大变革的前夜。

Klarna 的CEO Sebastian Siemiatkowski

我倒是深信不疑——Klarna 的举措不仅仅代表着一家企业的战略调整,它揭示了一个更为广泛的现实:传统的软件开发模式正在走向终结。这段时间我很容易就沉浸在Cursor (集成几个大模型的代码编辑器丝滑自动生成一组编程代码)中,感觉一个掌握了 与AI对话『秘籍』 的普通人,也可以在短时间内制作一个能够解决具体问题的应用程序。这种生产力的提升,无疑在加速软件行业的变革。企业和组织中,如果这种『普通人』很积极主动,那一定会加速这个趋势:对外部软件平台的依赖减少,开发和管理软件的成本显著降低。

将某一个报告中的图片图表,传给Cursor内置的Claude 3.5,多模态的大模型识别图中内容,制作一个动态图表,你什么都不用操心,只管布置任务即可。

在X上有关Klarna这个决定的讨论,大部分都是支持和击节叫好。中国的SaaS还没有起飞,就要快速降落了。甚至整个软件行业都要岌岌可危了。那软件行业还有什么值得去投入的?是不是年轻人还是早点离开这个行业?还是说软件行业会诞生新的模式?

Alexandr 王的高论

我又想起Alexandr 王的创业公司Scale AI。一个97年的华人小伙儿,就是用『玩玩看』的心态创建了一家数据标注公司(这显得一点都不高大上啊),才5年时间,公司估值就飙到了138亿,对,还是美元!太疯狂了。

Alexandr 王 与20VC的投资人大佬前阵子做了一次深度的访谈。从他个人创业的角度解读当下的 AI 发展与数据的未来,王关注的全部都是全球 AI 行业中的“新质生产力”——他认为这股力量正由数据驱动,悄然重塑整个软件行业。不过访谈中听得出他完全站在美国人的角度上,分析了中国对美国在AI领域的挑战和威胁。我听下来多多少少有些不舒服,毕竟屏幕中还是张那么清晰的中国脸。

Scale AI的业务在飙升。用报告的图片生成动态图表,一分钟搞定

王反复强调AI 模型的发展瓶颈不再是算力或算法,而是数据。算力增长的速度已经远超数据的积累速度,导致模型的性能无法像以往那样迅速提升。正如他指出:“我们已经用尽了互联网上几乎所有的免费数据。”这并不是一个简单的技术问题,而是预示着一次新的行业机会。因为目前对于大模型来说,已经遇到了数据的匮乏困境。他提到,GPT-4 的训练数据约为 1PB,而摩根大通公司内部拥有的专有数据量高达 150PB。这个差距让我惊掉下巴了。原来组织内部掌握的数据比互联网数据要多的太多了!这也让我认识到,数据的价值远远没有被完全挖掘。虽然 GPT-4 已经在互联网上对海量数据进行了训练,但这些数据主要是低门槛、免费获取的“简单数据”,并不能支持 AI 在更复杂任务中的表现。

他还特别指出,今天互联网所能提供的免费数据已经被使用殆尽,这也是 GPT-4 性能提升放缓的原因之一。未来,高级数据将成为推动 AI 进一步发展的关键。这些高级数据不仅规模庞大,而且质量上乘,能够提供更加复杂和精确的推理支持。例如,摩根大通的 150PB 数据不仅包括股票、债券、外汇的交易信息,还涵盖了公司对市场的分析、风险管理,以及对客户行为的预测。相比之下,GPT-4 的 1PB 数据量仅仅是互联网公开数据,在人类所生成的所有数据中,这只是冰山一角。但没有谁能轻松免费的将那些高质量的数据揽入囊中。

企业的数据宝藏:未被开发的财富

如果你是一家拥有庞大数据资产的企业,想必你已经意识到,这些数据不仅仅是一种资源,它们是未来竞争的护城河。王提到,像摩根大通、谷歌、特斯拉这样的企业,内部都拥有巨量的专有数据,但这些数据大多是非结构化的,无法直接用于 AI 模型的训练。这也是 AI 发展面临的另一个重大挑战。(他这样说也肯定有自己的私心,毕竟他的创业公司就是做数据标注的)

我认为另外一点——对机器更友好的数据接口,在未来将成为企业的核心能力之一。如今,许多企业拥有大量的非结构化数据,这些数据可能以文本、图片、视频等形式存在,甚至是分散于多个部门和系统中。如何将这些数据转化为结构化、标准化的数据形式,并通过统一的接口提供给 AI 模型进行训练,是企业能否充分利用其数据资源的关键。企业需要构建更灵活且高效的数据接口,以便机器能够更轻松地获取、理解并利用这些数据。

这也是为什么未来的企业不只是要积累数据,还必须具备强大的数据结构化能力。通过发展更适合 AI 模型的接口,企业可以确保数据能够被快速消化、处理,并为 AI 模型提供高效的训练素材。王所说的“数据瓶颈”实际上不仅仅是数据量的问题,更是数据格式和接口的现代化问题

数据提炼的创业机会:AI 驱动的增长点

在这个充满机遇的时代,提炼数据的价值将成为创业公司的新增长点。王提到了一个名为 Limitless 的公司,这家公司推出了一款售价 99 美元的可穿戴设备,能够全天候记录用户的对话,并将其转化为结构化数据。这些数据虽然看似琐碎,但经过预处理和清洗后,能为 AI 模型提供高质量的训练素材。

这仅仅是一个看起来并没有太多意思的小案例,但这个案例非常启发人——全天候的自我转化对机器友好的数据。王认为,未来的创业机会将集中在如何通过 AI 技术重新挖掘企业内部的高质量数据。这些数据并非简单的历史记录,而是企业在执行复杂任务时产生的深度思考和推理。例如,银行的反欺诈分析师在分析可疑交易时,往往需要参考多种数据源并进行复杂的推理,而这一过程从未被记录下来。捕捉并结构化这些复杂推理过程的数据,将成为推动下一代 AI 模型发展的关键。

数据时代的核心技能:编程、数学与 AI 对话

当我们谈到未来的技能时,我更加觉得,学习编程、学习数学以及与 AI 对话的能力,将成为每个人在未来世界中保持竞争力的核心。在这个数据驱动的时代,掌握这些技能不仅能够帮助个人快速适应市场变化,还能为企业提供巨大的价值。

生成式 AI 工具的普及,降低了编程的门槛,使得更多人能够参与到软件开发和数据处理的过程中。未来,编程能力将不再是少数人的特权,而是一种基础技能。与此同时,与 AI 模型进行有效对话,提出合适的 Prompt,将成为每个人必须掌握的能力。

王也还提到了一个有趣的现象:今天的很多顶级开发者,比如 OpenAI 的联合创始人 Andrej Karpathy,已经开始用自然语言(如英语)来给 AI 模型下指令,而不是传统的编程语言(大神也都这样干了??​)。这种工作方式的转变,意味着未来的开发者不仅需要掌握编程技能,还需要学会如何与 AI 进行高效的沟通。

结语:数据驱动下的新征程

今天,结合着几位牛人(刀哥,白鸦,Sebastian,王)的观点,写作的过程中梳理一下思路,我看到了一个清晰的未来:软件行业正在经历一场由 AI 自动化和数据驱动的深刻变革。传统的软件开发模式正在迅速被淘汰,数据的价值正在被重新定义。企业的竞争将围绕谁能够更好地利用 AI 工具和挖掘高质量数据展开。

对企业来说,开发对机器更友好的数据接口,将成为能否在激烈竞争中胜出的另外一项关键。构建一个能够快速转化、处理数据的系统,不仅能够提升 AI 模型的性能,还能帮助企业将数据转化为真正的竞争优势。

对于个人来说,掌握 AI 工具、持续练习编程和数据分析能力,仍然是成为在这个时代保持竞争力的法门。未来的赢家一定是那些能够快速适应变化、通过 AI 提升效率的公司和个人。但你需要大量的尝试,每天都拥抱数据、善用 AI,这是可以缓解职场焦虑的现实版本的活在当下。