遥遥领先的OpenAI慢下来了

白鲸出海

白鲸出海，泛互联网出海服务平台，白鲸专注于具备互联网属性的行业、公司、产品和服务的出海，包括应用、游戏、电商、区块链、智能手机及硬件、旅游、网络文学、影视、动漫、教育、体育和金融等。

510

2024-05-14 22:01

510

白鲸出海

“如果发布的是 GPT-5，那 OpenAI 依然遥遥领先。如果是 AI Search 或者是语音助手，那就说明 OpenAI 没落了。”

一位 AI 大模型从业者告诉虎嗅，业内对 OpenAI 的期待太高，除非是 GPT-5 这样的颠覆式创新，否则很难满足观众的“胃口”。

虽然 Sam Altman 在 OpenAI 线上直播前，已经预告不会发布 GPT-5（或 GPT-4.5），但外界对 OpenAI 的期待早已是九牛拉不转了。

北京时间 5 月 14 日凌晨，OpenAI 公布了最新的 GPT-4o，o 代表 Omnimodel（全能模型）。20 多分钟的演示直播，展示了远超当前所有语音助手的 AI 交互体验，与外媒此前透露的消息基本重合。

虽然 GPT-4o 的演示效果仍可称得上“炸裂”，但业内人士普遍认为很难配得上 Altman 预告中的“魔法”二字。很多人认为，这些功能性的产品，都是“偏离 OpenAI 使命”的。

OpenAI 的 PR 团队似乎也预料到了这种舆论走向。发布会现场以及会后 Altman 发布的博客中对此解释道：

“我们使命的一个关键部分是将非常强大的人工智能工具免费（或以优惠的价格）提供给人们。我非常自豪我们在 ChatGPT 中免费提供了世界上最好的模型，没有广告或类似的东西。

当我们创办 OpenAI 时，我们最初的想法是我们要创造人工智能并利用它为世界创造各种利益。相反，现在看起来我们将创造人工智能，然后其他人将使用它来创造各种令人惊奇的事物，让我们所有人都受益。”

遥遥领先的 GPT-4o

“如果我们必须等待 5 秒钟才能得到‘每个’回复，用户体验就会一落千丈。即使合成音频本身听起来很真实，它也会破坏沉浸感，让人感觉毫无生气。”

在 OpenAI 发布会前夕，英伟达 Embodied AI 负责人 Jim Fan 在 X 上预测了 OpenAI 会发布的语音助手，并提出：

几乎所有的语音 AI 都会经历三个阶段：

1. 语音识别或“ASR”：音频->文本1，例如 Whisper；

2. 计划下一步要说什么的 LLM：text1 -> text2;

3. 语音合成或“TTS”：text2 ->音频，例如 ElevenLabs 或 VALL-E。

经历 3 个阶段会导致巨大的延迟。

GPT-4o 在响应速度方面，几乎解决了延迟问题。GPT-4o 的响应音频输入的最短时长为 232 毫秒，平均响应时长 320 毫秒，几乎与人类相似。没有使用 GPT-4o 的 ChatGPT 语音对话功能平均延迟为 2.8 秒 (GPT-3.5) 和 5.4 秒（GPT-4)。

GPT-4o 不仅通过缩短延迟极大地提升了体验，还在 GPT-4 的基础上做了很多升级包括：

1、极佳的多模态交互能力，包括语音、视频，以及屏幕共享。

2、可以实时识别和理解人类的表情，文字，以及数学公式。

3、交互语音感情丰富，可以变换语音语调、风格，还可以模仿，甚至“即兴”唱歌。

4、超低延时，且可以在对话中实时打断 AI，增加信息或开启新话题。

5、所有 ChatGPT 用户均可免费使用（有使用上限）。

6、速度是 GPT-4 Turbo 的 2 倍，API 成本低 50%，速率限制高 5 倍。

“没落”的 OpenAI

“这些局限性的突破都是创新。”

有业内专家认为，GPT-4o 的多模态能力只是“看起来”很好，实际上 OpenAI 并未展示对于视觉多模态来说真正算是“突破”的功能。

这里我们按大模型行业的习惯，对比一下隔壁厂 Anthropic 的 Claude 3。

Claude 3 的技术文档中提到，“虽然 Claude 的图像理解能力是尖端的，但需要注意一些局限性”。

其中包括：

1、人物识别：Claude 不能用于在图像中识别（即姓名）人物，并将拒绝这样做。

2、准确性：Claude 在解释 200 像素以下的低质量、旋转或非常小的图像时，可能会产生幻觉或犯错误。

3、空间推理：克劳德的空间推理能力有限。它可能很难完成需要精确定位或布局的任务，例如读取模拟钟面或描述棋子的确切位置。

4、计数：Claude 可以给出图像中物体的近似计数，但可能并不总是精确准确的，特别是对于大量小物体。

5、AI 生成的图像：Claude 不知道图像是否是人工智能生成的，如果被问到，可能不正确。不要依赖它来检测假图像或合成图像。

6、不适当的内容：Claude 不会处理违反我们可接受使用政策的不适当或露骨的图像。

7、医疗保健应用：虽然 Claude 可以分析一般医学图像，但它不是为解释 CT 或 MRI 等复杂诊断扫描而设计的。Claude 的输出不应被视为专业医疗建议或诊断的替代品。

在 GPT-4o 网站发布的案例中，有一些与“空间推理”有相关的能力，但仍难算得上突破。

此外，从发布会现场演示中 GPT-4o 输出的内容很容易看出，其模型能力与 GPT-4 相差并不大。

GPT-4o 跑分

虽然模型可以在对话中增加语气，甚至即兴演唱，但对话内容还是与 GPT-4 一样缺乏细节和创造力。

此外，发布会后 OpenAI 官网还发布了 GPT-4o 的一系列应用案例探索。包括：照片转漫画风格；会议记录；图片合成；基于图片的 3D 内容生成；手写体、草稿生成；风格化的海报，以及连环画生成；艺术字体生成等。

而这些能力中，照片转漫画风格、会议记录等，也都是一些看起来很普通的文生图或者是AI大模型功能。

能挑战现有的商业模式吗？

“我注册 5 个免费的 ChatGPT 账号，是不是就不需要每月花 20 美元订阅 ChatGPT Plus 呢？”

OpenAI 公布的 GPT-4o 使用政策是 ChatGPT Plus 用户比限制普通用户的流量限制高 5 倍。

GPT-4o 对所有人免费，首先挑战的似乎是 OpenAI 自己的商业模型。

第三方市场分析平台 Sensor Tower 公布的数据显示，过去一个月中，ChatGPT 在全球 App Store 中的下载量为 700 万，订阅收入 1200 万美元；全球 Google Play 市场的下载量为 9000 万，订阅收入 300 万美元。

目前，ChatGPT Plus 在两个应用商店的订阅价格均为 19.99 美元。由订阅数据推断，ChatGPT Plus 过去一个月中，通过应用商店付费的订阅用户数为 75 万。虽然 ChatGPT Plus 还有大量的直接付费用户，但从手机端的收入来看，每年进项才不到 2 亿美元，再翻几倍也很难撑起 OpenAI 近千亿的估值。

由此来看，OpenAI 在个人用户充值方面，其实并不需要考虑太多。

更何况 GPT-4o 主打体验好，如果你跟 AI 聊着聊着就断了，还要换账号重新聊，那你会不会愤然充值呢？

“最初的 ChatGPT 暗示了语言界面的可能性；这个新事物给人的感觉有本质上的不同。它快速、智能、有趣、自然且有帮助。”

Sam Altman 的最新博客中提到了“语言界面的可能性”，这也正是 GPT-4o 接下来可能要做的：挑战所有 GUI（图形交互界面），以及想要在 LUI（语音交互界面）上发力的人。

结合近期外媒透出的 OpenAI 与苹果合作的消息，可以猜测 GPT-4o 可能很快就要对所有 AI PC、AI 手机的厂商“抛橄榄枝”或是“掀桌子”。

不管是哪种语音助手或是 AI 大模型，对于 AIPC、AI 手机来说核心价值都是优化体验，而 GPT-4o 一下把体验优化到了极致。

GPT-4o 很可能会卷到所有已知的 App，甚至是 SaaS 行业。过去一年多时间里，市场上所有已经开发和正在开发的 AI Agent 都会面临威胁。

某位资源聚合类 app 产品经理曾对虎嗅表示，“我的操作流程就是产品的核心，如果操作流程被你 ChatGPT 优化了，那相当于我的 App 没价值了。”

试想，如果订外卖的 App，UI 变成了一句话“给我订餐”，那打开美团还是打开饿了么，对于用户来说就一样了。

厂商的下一步只能是压缩供应链、生态的利润空间，甚至是恶性价格战。

从目前的形式来看，其他厂商要在模型能力上打败 OpenAI 恐怕还需要一段时间。

产品要对标 OpenAI，可能只有通过做更“便宜”的模型了。

对于国内产业的影响

“最近忙死了，没顾上关注他们。”

一位工业 AI 大模型创始人告诉虎嗅，近期一直在忙着沟通战略合作、产品发布、客户交流资本交流，完全没有时间关注 OpenAI 这种发布。

OpenAI 发布前，虎嗅也询问了多位来自各行各业的国内 AI 从业者，他们对 OpenAI 最新发布的预测与看法都很一致：非常期待，但与我无关。

一位从业者表示，从国内目前的进度来看，要在短期内追上 OpenAI 不太现实。所以关心 OpenAI 发布了什么，最多也就是看看最新的技术方向。

目前国内公司在 AI 大模型研发方面，普遍比较关注工程化和垂直模型，这些比较务实、容易变现的方向。

在工程方面，近期蹿红的 Deepseek 就正在国内大模型行业中掀起 Token 的价格战。在垂直模型方面，多位业内人士告诉虎嗅，短期内小模型和垂直模型的研发，基本都不会受到 OpenAI 的裹挟。

“有时候 OpenAI 的技术方向也不是很值得借鉴。”一位模型专家对虎嗅表示，Sora 就是个很好的例子，2024 年 2 月 OpenAI 发布了视频模型 Sora，实现了 60 秒的视频稳定输出。虽然看起来效果很好，但后续的实践几乎没有，落地速度也非常慢。

在 Sora 之前，国内很多在文生视频领域发力的公司和机构已经实现了 15 秒稳定视频生成，而 Sora 出来以后，一些公司的研发、融资、产品节奏都被打乱了，甚至使整个文生视频行业的发展演变成了一场“技术的大跃进”。

所幸，这次 GPT-4o 与 Sora 大有不同。OpenAI CTO Muri Murati 表示，在接下来的几周内，我们将继续我们的迭代部署，为您提供所有功能。

发布会结束不久，GPT-4o 就已经可以上线试用了。

流量 app

免责声明

本文链接:

本文经作者许可发布在DNY123跨境头条，如有疑问，请联系客服。

大境物流

印马菲越泰专线物流、海陆运拼柜、整柜物流

海星海外仓

马来西亚仓就用海星仓，让跨境出海东南亚更简单

蓝翼物流

马新泰印菲越专线物流，海陆空一手大庄！

千易ERP

跨境生意，有千易，更容易。从产品采集刊登、订单运营、采购管理、库存管理到财务核算，致力于提供一站式经营管理解决方案，助力卖家拓展全球电商业务。

大境物流

印马菲越泰专线物流、海陆运拼柜、整柜物流

海星海外仓

马来西亚仓就用海星仓，让跨境出海东南亚更简单

蓝翼物流

马新泰印菲越专线物流，海陆空一手大庄！

千易ERP

最新热门报告标签

小额免税“复活甲”上线？越南税收魔改下，卖家夹缝中反复横跳

编辑｜果然投稿爆料/转载添加 | DNY123-0401 越南电商税务新政按下“暂停键”越南税务政策又上演过山车剧情！原定于 2025 年 4 月 1 日正式生效的《税收管理法》修正案，要求电商平台强制代扣代缴税款，却在实施前夕被 Shopee 与 Lazada “喊停”。这场让卖家熬夜准备的 “税务突击考试”，最终因越南政府 “没划重点”（未发布实施细则）而临时取消。（文末扫码进群）网友调侃

【DNY123跨境早报】淘宝英文版上线东南亚，下载量激增；特朗普“对等关税”对中国征收34%；新加坡联手Shopee、Lazada下架此类商品

跨境早报60秒，知晓东南亚跨境电商大小事

Shopee等平台多家店铺被揪出，数千万假货在菲遭缴；苹果16正式上线印尼；TikTok电商越南暂不代扣税款

“长江经济带-广州港-东南亚”海丝电商快线启动在湖南城陵矶新港多式联运物流园，“长江经济带－广州港－东南亚”海丝电商快线首发仪式暨“湘粤海丝”全程物流产品发布会隆重召开。此次开通的海丝电商快线，通过铁路、航运、物流及跨境电商等多方紧密协作，不仅打破了信息壁垒，还大幅提升了物流整合效率。1-2月我国服务进出口总额达13095.6亿元根据商务部服贸司负责人的介绍，2025年1-2月我国服务贸易保持较快

【招聘上新】三大地区开招，内含运营、销售、主管等多种岗位！

人才招聘令本周招聘岗位：TikTok马来西亚市场运营、母婴类目开发、母婴类目运营、海外仓销售员、销售主管、资深HR招聘经理（出海与跨境电商方向）、FDA办理对接专员、电商直播运营专员、行政专员/主管、跨境电商运营专员（Shopee/Lazada/TikTok）、商务英语翻译（口译/笔译方向）求职者看过来👀，运营、市场、物流、财税等多领域跨境电商岗位将在群内每日上新，扫码添加DNY123官方企微回复

一键击破实战痛点，东南亚首场双引擎驱动流量大会圆满落幕！

3月28日，【聚势东南亚拓赢全球——内容+货架双引擎驱动新流量大会】在厦门凯悦酒店3楼大宴会厅成功举办，本次活动由DNY123东南亚电商导航与PingPong联合主办。本次大会通过构建「主会场战略赋能+分会场战术攻坚」的双轨体系，打造跨境电商全维度解决方案。全天会议将依托“内容电商x货架电商“的线上与线下的融合，助力卖家构建全域流量护城河，实现品牌出海从单点突破到生态矩阵的进化跃迁。据统计，此次

Shopee与Lazada暂缓越南税款代扣；这类产品线上销售屡禁不止，菲律宾要求监管加码；Shopee菲律宾更新搬仓时间线

中老铁路货物运输突破5600万吨从中国铁路昆明局集团有限公司获悉，自中老铁路开通运营以来，货物运输实现了“从通到畅、从畅到快、从快到旺”的显著转变。截至3月30日，这条连接中国与老挝的重要物流通道累计运输货物已突破5600万吨，其中跨境货物量达到了1300万吨。上周监测港口货物吞吐量突破27000万吨根据交通运输部及国务院物流保通保畅工作领导小组办公室的监测数据，3月24日至3月30日全国货运物流

【DNY123跨境早报】TikTok Shop&Tokopedia首个斋月大促狂飙；《哪吒2》在泰国累计创收票房3690万泰铢；越南降低多种商品关税

跨境早报60秒，知晓东南亚跨境电商大小事

【Shopee市场周报】虾皮智利站2025年4月第1周市场周报

暂无简介...

【DNY123跨境早报】淘宝英文版上线东南亚，下载量激增；特朗普“对等关税”对中国征收34%；新加坡联手Shopee、Lazada下架此类商品

跨境早报60秒，知晓东南亚跨境电商大小事

【DNY123跨境早报】TikTok Shop&Tokopedia首个斋月大促狂飙；《哪吒2》在泰国累计创收票房3690万泰铢；越南降低多种商品关税

跨境早报60秒，知晓东南亚跨境电商大小事

Shopee与Lazada暂缓越南税款代扣；这类产品线上销售屡禁不止，菲律宾要求监管加码；Shopee菲律宾更新搬仓时间线

Shopee等平台多家店铺被揪出，数千万假货在菲遭缴；苹果16正式上线印尼；TikTok电商越南暂不代扣税款

【招聘上新】三大地区开招，内含运营、销售、主管等多种岗位！

一键击破实战痛点，东南亚首场双引擎驱动流量大会圆满落幕！