2023 年末，埃隆·马斯克旗下的 xAI 推出了 Grok，最初只向 X（前 Twitter）的 Premium 用户开放，被定位为"有个性、不回避敏感话题"的 AI 助手。2024 年，随着 Grok 2 和 Grok 3 的发布，它在技术能力上快速追赶，并且在某些评测上开始超越同期版本的 ChatGPT 和 Claude。

Grok 是什么

Grok 是 xAI 开发的大语言模型，通过 X 平台、grok.x.ai 网站以及 iOS/Android 应用提供服务。它最有特色的两点：

实时 X（Twitter）数据访问：能搜索 X 上的最新帖子和热点话题，回答当下发生的事情
更少的内容限制：相比 ChatGPT 和 Claude，Grok 在回答一些边界性问题时更直接，"政治正确"程度更低

这两个特点让它在一部分用户里很受欢迎，也让它颇有争议。

Grok 3 的技术能力

2025 年 2 月发布的 Grok 3 在多项评测上表现出色：

数学和推理： Grok 3 在 AIME（美国数学邀请赛）等数学评测上超过了同期的 GPT-4o 和 Claude 3.5 Sonnet，接近 DeepSeek-R1 的水平。

Grok 3 Think（深度思考模式）： 类似 OpenAI 的 o1 和 DeepSeek-R1，Grok 3 Think 模式会在回答前进行链式推理，显示思考过程，适合复杂的数学、逻辑、科学问题。

代码能力： 在 SWE-bench（真实软件工程问题评测）上，Grok 3 表现接近 Claude 3.5 Sonnet，明显优于 GPT-4o。

DeepSearch（深度搜索）： 类似 Perplexity 的 Deep Research，Grok 的深度搜索会自主规划多轮搜索，整合大量信息后生成报告——但它还能搜索 X 上的实时内容，这是其他工具没有的。

X（Twitter）实时数据：核心差异化

这是 Grok 最独特的能力，也是它和其他 AI 助手最大的区别。

Grok 可以实时搜索 X 上的内容，包括：

当前热门话题和趋势
特定账号的最新发帖
关于某事件的最新讨论
特定关键词的实时帖子流

这让它能回答"今天 X 上大家在讨论什么"、"某个 KOL 最近发了什么"、"这个话题最新的进展是什么"——这些问题 ChatGPT 和 Claude 即使开启联网也很难做得这么实时和深入。

对于需要跟踪社交媒体热点的人（媒体、营销、投资分析），这个能力有实际价值。

内容策略：更少限制

Grok 在内容限制上比 ChatGPT 和 Claude 更宽松，这是设计决策而不是疏漏。

马斯克多次公开批评其他 AI 工具"太政治正确"、"回避真实问题"，Grok 的设计方向是"直接说出你真正想说的话"，即使涉及争议性话题也不回避正面讨论。

在实际体验里，这意味着：

一些 ChatGPT 会婉拒的问题，Grok 会直接回答
政治、历史争议事件，Grok 会给出更多元的视角而不是只给"平衡的官方表述"
幽默和讽刺感更强，对话有明显的个性色彩（这是"Grok"这个名字的来源——Heinlein 科幻小说里意为"深刻理解"）

这种风格吸引了一部分用户，但也有人觉得过于随意甚至不够可靠，需要根据自己的使用场景判断。

图像生成

Grok 集成了 Aurora 图像生成模型，可以在对话中生成图片。和 DALL-E 3 相比，Aurora 在内容限制上也相对宽松——一些 ChatGPT 会拒绝的图像生成请求，Grok 可能会接受。

质量上属于中等水准，满足一般配图需求没问题。

价格和访问

X Free 用户： 可以使用 Grok 的基础功能，有使用限制
X Premium（$8/月）： 更多访问次数，可以使用 Grok 2
X Premium+（$22/月）： 完整的 Grok 3 访问，Deep Search，Think 模式，图像生成，更高使用额度
Grok.com 独立访问（免费版）： 不需要 X 订阅，可以使用 Grok 3 的有限功能

在中国大陆，X 平台和 Grok 都需要科学上网。

谁适合用

X 平台重度用户： 你本来就在用 X，订阅了 Premium，Grok 是自然附带的 AI 工具。实时搜索 X 内容、分析热点趋势，是它在这个人群里的核心价值。

需要实时社交媒体情报的人： 媒体人、营销策划、市场分析师——跟踪热点、了解舆论，Grok 的 X 数据访问是其他工具难以复制的能力。

对其他 AI 工具内容限制感到不满的人： 如果你经常碰到 ChatGPT "我无法帮助这个"，Grok 可能会给你更直接的答案。

数学和推理密集场景： Grok 3 的推理能力属于第一梯队，如果你对这方面有高要求，值得试试。

和竞品的比较

vs ChatGPT： ChatGPT 的生态更成熟（插件、GPTs、DALL-E），整体应用场景更广。Grok 在实时 X 数据和内容宽松度上有差异化。

vs Claude： Claude 在写作质量和代码上很强。Grok 在数学推理上和 Claude 3.5 相当，联网实时性更强。

vs DeepSeek： DeepSeek 完全免费，数学推理是强项，国内访问无障碍。Grok 在社交数据集成上是独有能力。

vs Perplexity： Perplexity 专注于带引用的搜索回答，信息来源更清晰。Grok 的 X 数据覆盖是 Perplexity 没有的，但 Perplexity 的引用来源更透明。

Grok 是一个有鲜明特色的 AI 工具——和 X 平台的深度整合、相对宽松的内容策略、以及快速提升的技术能力，让它在竞争激烈的 AI 助手市场里找到了自己的位置。如果你在 X 上活跃，或者希望有一个"不那么谨慎"的 AI 助手，值得试试。