知识图谱是什么?Knowledge Graph 详解

7600知识图谱Knowledge Graph实体关系

知识图谱是一种用“实体”和“关系”组织知识的方法。它不像普通文档那样只保存一段段文字,而是把人、公司、产品、地点、概念之间的关系连成一张可查询的知识网络

知识图谱与实体关系网络
知识图谱与实体关系网络

知识图谱是一种用“实体”和“关系”组织知识的方法。它不像普通文档那样只保存一段段文字,而是把人、公司、产品、地点、概念之间的关系连成一张可查询的知识网络。

比如“OpenAI 开发了 ChatGPT”“ChatGPT 属于生成式 AI 产品”“生成式 AI 依赖大语言模型”这些信息,在知识图谱里会被拆成一个个节点和边。节点是实体,边是关系。这样系统不仅知道某个词出现过,还能知道它和其他事物有什么连接。

先用一句话抓住它

知识图谱像一张概念关系地图:不只记录“有哪些东西”,还记录“它们之间是什么关系”。

生活里的类比是家谱和城市地图的结合。家谱告诉你谁是谁的父母、兄弟、配偶;城市地图告诉你哪些道路连接哪些地点。知识图谱则把各种对象和关系放进同一张网络里,方便追问、推理和查找路径。

它为什么重要

普通文档适合阅读,但不一定适合机器理解关系。搜索一篇公司介绍时,你能看到一段文字;但如果要问“这家公司旗下有哪些产品、这些产品用了哪些模型、哪些模型又支持哪些能力”,纯文本检索就不够直接。

flowchart LR
    OpenAI["OpenAI"] -->|开发| ChatGPT["ChatGPT"]
    ChatGPT -->|属于| GenAI["生成式 AI"]
    ChatGPT -->|基于| LLM["大语言模型"]
    LLM -->|使用| Token["Token"]
    RAG["RAG"] -->|常结合| KG["知识图谱"]
    KG -->|组织| Entity["实体与关系"]

知识图谱的价值在于把隐含关系显式化。它可以帮助系统回答“谁和谁有关”“某个概念属于哪一类”“从 A 到 B 之间有什么路径”“哪些条件同时满足”等问题。对企业知识库、搜索推荐、风控、客服和数据治理都很有用。

和向量数据库的区别

向量数据库擅长找“意思相近”。比如用户问“报销流程”,资料里写“费用审批”,向量搜索能把它们匹配起来。知识图谱擅长找“关系明确”。比如“这个客户关联哪些订单”“这个产品依赖哪些供应商”“这个概念属于哪个上位分类”。

两者经常一起用。向量检索先找到语义相关内容,知识图谱再补充实体关系和结构化路径。前者更像按含义找书,后者更像查一张关系网。

和 RAG、GraphRAG 的关系

RAG 通常是“先检索资料,再让模型回答”。传统 RAG 常依赖关键词搜索或向量搜索,找出若干相关片段。知识图谱可以让 RAG 不只找到相似片段,还能沿着实体关系扩展上下文。

GraphRAG 可以理解为把图结构引入 RAG 的一类做法。它会从文档中抽取实体和关系,形成图谱,再在回答问题时结合图上的社区、路径或相关节点。这样做的好处是更容易处理跨文档、跨实体、需要关系推理的问题。

它常出现在哪里

搜索引擎会用知识图谱理解人、地点、电影、公司和概念之间的关系。企业内部可以用它整理组织架构、产品线、客户、合同、知识库和业务规则。推荐系统可以通过“用户、物品、标签、行为”的关系网络发现相关内容。

在 AI 应用里,知识图谱也常被用来增强问答、减少幻觉、支持可解释推荐和做权限过滤。比如客服系统回答产品问题时,可以沿着“产品 - 版本 - 功能 - 常见问题 - 解决方案”的关系来组织上下文。

容易误解的地方

知识图谱不是把一堆文档画成漂亮的网络图就结束了。真正有用的图谱需要稳定的实体定义、关系类型、数据来源、更新机制和质量检查。否则图看起来很复杂,实际查询却不准。

另一个误区是以为知识图谱一定比向量检索更高级。它们解决的问题不同:图谱强调关系结构,向量强调语义相似。很多实际系统会把两者结合,而不是二选一。

怎么判断它该不该用

如果你的问题主要是“这段文字和哪个问题意思相近”,向量数据库可能更直接。如果你的问题经常涉及实体、分类、层级、因果、依赖、归属和路径,知识图谱就很有价值。

使用知识图谱时,要先从小范围开始:明确实体类型、关系类型和典型查询问题。不要一开始就试图把所有知识都塞进去。能回答真实业务问题的图谱,才是有用的图谱。

资料来源