2023 年末,埃隆·马斯克旗下的 xAI 推出了 Grok,最初只向 X(前 Twitter)的 Premium 用户开放,被定位为"有个性、不回避敏感话题"的 AI 助手。2024 年,随着 Grok 2 和 Grok 3 的发布,它在技术能力上快速追赶,并且在某些评测上开始超越同期版本的 ChatGPT 和 Claude。
Grok 是什么
Grok 是 xAI 开发的大语言模型,通过 X 平台、grok.x.ai 网站以及 iOS/Android 应用提供服务。它最有特色的两点:
- 实时 X(Twitter)数据访问:能搜索 X 上的最新帖子和热点话题,回答当下发生的事情
- 更少的内容限制:相比 ChatGPT 和 Claude,Grok 在回答一些边界性问题时更直接,"政治正确"程度更低
这两个特点让它在一部分用户里很受欢迎,也让它颇有争议。
Grok 3 的技术能力
2025 年 2 月发布的 Grok 3 在多项评测上表现出色:
数学和推理: Grok 3 在 AIME(美国数学邀请赛)等数学评测上超过了同期的 GPT-4o 和 Claude 3.5 Sonnet,接近 DeepSeek-R1 的水平。
Grok 3 Think(深度思考模式): 类似 OpenAI 的 o1 和 DeepSeek-R1,Grok 3 Think 模式会在回答前进行链式推理,显示思考过程,适合复杂的数学、逻辑、科学问题。
代码能力: 在 SWE-bench(真实软件工程问题评测)上,Grok 3 表现接近 Claude 3.5 Sonnet,明显优于 GPT-4o。
DeepSearch(深度搜索): 类似 Perplexity 的 Deep Research,Grok 的深度搜索会自主规划多轮搜索,整合大量信息后生成报告——但它还能搜索 X 上的实时内容,这是其他工具没有的。
X(Twitter)实时数据:核心差异化
这是 Grok 最独特的能力,也是它和其他 AI 助手最大的区别。
Grok 可以实时搜索 X 上的内容,包括:
- 当前热门话题和趋势
- 特定账号的最新发帖
- 关于某事件的最新讨论
- 特定关键词的实时帖子流
这让它能回答"今天 X 上大家在讨论什么"、"某个 KOL 最近发了什么"、"这个话题最新的进展是什么"——这些问题 ChatGPT 和 Claude 即使开启联网也很难做得这么实时和深入。
对于需要跟踪社交媒体热点的人(媒体、营销、投资分析),这个能力有实际价值。
内容策略:更少限制
Grok 在内容限制上比 ChatGPT 和 Claude 更宽松,这是设计决策而不是疏漏。
马斯克多次公开批评其他 AI 工具"太政治正确"、"回避真实问题",Grok 的设计方向是"直接说出你真正想说的话",即使涉及争议性话题也不回避正面讨论。
在实际体验里,这意味着:
- 一些 ChatGPT 会婉拒的问题,Grok 会直接回答
- 政治、历史争议事件,Grok 会给出更多元的视角而不是只给"平衡的官方表述"
- 幽默和讽刺感更强,对话有明显的个性色彩(这是"Grok"这个名字的来源——Heinlein 科幻小说里意为"深刻理解")
这种风格吸引了一部分用户,但也有人觉得过于随意甚至不够可靠,需要根据自己的使用场景判断。
图像生成
Grok 集成了 Aurora 图像生成模型,可以在对话中生成图片。和 DALL-E 3 相比,Aurora 在内容限制上也相对宽松——一些 ChatGPT 会拒绝的图像生成请求,Grok 可能会接受。
质量上属于中等水准,满足一般配图需求没问题。
价格和访问
- X Free 用户: 可以使用 Grok 的基础功能,有使用限制
- X Premium($8/月): 更多访问次数,可以使用 Grok 2
- X Premium+($22/月): 完整的 Grok 3 访问,Deep Search,Think 模式,图像生成,更高使用额度
- Grok.com 独立访问(免费版): 不需要 X 订阅,可以使用 Grok 3 的有限功能
在中国大陆,X 平台和 Grok 都需要科学上网。
谁适合用
X 平台重度用户: 你本来就在用 X,订阅了 Premium,Grok 是自然附带的 AI 工具。实时搜索 X 内容、分析热点趋势,是它在这个人群里的核心价值。
需要实时社交媒体情报的人: 媒体人、营销策划、市场分析师——跟踪热点、了解舆论,Grok 的 X 数据访问是其他工具难以复制的能力。
对其他 AI 工具内容限制感到不满的人: 如果你经常碰到 ChatGPT "我无法帮助这个",Grok 可能会给你更直接的答案。
数学和推理密集场景: Grok 3 的推理能力属于第一梯队,如果你对这方面有高要求,值得试试。
和竞品的比较
vs ChatGPT: ChatGPT 的生态更成熟(插件、GPTs、DALL-E),整体应用场景更广。Grok 在实时 X 数据和内容宽松度上有差异化。
vs Claude: Claude 在写作质量和代码上很强。Grok 在数学推理上和 Claude 3.5 相当,联网实时性更强。
vs DeepSeek: DeepSeek 完全免费,数学推理是强项,国内访问无障碍。Grok 在社交数据集成上是独有能力。
vs Perplexity: Perplexity 专注于带引用的搜索回答,信息来源更清晰。Grok 的 X 数据覆盖是 Perplexity 没有的,但 Perplexity 的引用来源更透明。
Grok 是一个有鲜明特色的 AI 工具——和 X 平台的深度整合、相对宽松的内容策略、以及快速提升的技术能力,让它在竞争激烈的 AI 助手市场里找到了自己的位置。如果你在 X 上活跃,或者希望有一个"不那么谨慎"的 AI 助手,值得试试。
