注册

浅谈理论:为什么图论是当今各行各业必备的知识?

引子



“若无必要,勿增实体”--奥卡姆剃刀原理



图论(Graph Theory)是被大众严重低估的数学基础理论。它不是研究图像、图片、图表之类的理论,而是一个抽象而简单的数学理论。图论中的(Graph)是一个抽象概念,非常类似于关系网络(Relationship Network),有对应的节点(Node)或顶点(Vertext),节点之间又有关联关系或(Edge)。图论的概念非常简单,就是图、节点、边。本篇文章将简单的介绍一下图论的基础概念,以及图论在真实世界中的应用。(注意!本文不是科学论文,所以不会有枯燥的数学公式,请放心食用)


graph


图论简述


在图论中,有三个重要的概念:



  1. 节点(Node):可以理解为某个实体,例如关系网络中的张三、李四、王五;
  2. (Edge):可以理解为实体间的关系,例如,张三和李四是夫妻,王五是他们儿子;
  3. (Graph):可以理解为所有节点、边的集合,例如张三、李四、王五组成的幸福一家。

从上面的三个基本概念,我们可以推断出节点之间的关系,例如李四的大哥李一,就是王五的舅舅,王五也是他的侄子。


graph-basic-concepts


当然,图论的应用远不止于此,在我们真实世界中,图论的应用非常之广,以至于普通大众都难以察觉它的存在。


下面,我们将介绍一下图论在技术领域的常见应用。


搜索引擎


谷歌、百度、必应,这些都是我们日常使用的搜索引擎(Search Engine)。如果我们需要了解什么知识,一般会打开搜索引擎,输入关键词(Keyword),然后搜索引擎就会返回相关的结果,而且还通常极为精确。其实,搜索引擎技术背后的核心理论就是图论。


咱们可以将某个网站的每个网页(Web Page)想象成一个节点,页面上超链接(Hyperlink)就是对应的,而网站(Site)就是,其包含所有的网页(节点)以及网页关系(边),例如下图。


webpage-graph


而搜索引擎为什么能魔法般的将搜索结果返回给用户,就是巧妙应用了 PageRank 的算法,将节点关系用线性代数表示出来,然后计算与关键词最相似的节点或网页,最后实现搜索引擎的基础搜索功能。对 PageRank 算法感兴趣的朋友,可以查看相应的资料,网上很多,就不赘述了。


自然语言


自然语言(Natural Language)其实就是中文、英文、日文等自然人对话所使用的语言。例如,张三给李四说 “我爱你”,或者你问朋友 “上周我在市区发现了个超棒的咖啡馆,这周末有空一起去么?”,甚至本篇文章的所有文字,都是自然语言。


那么,图论跟自然语言有什么关系?其实,如果我们仔细思考下,会发现中文有主语、谓语、宾语三种词性,例如 “我爱你” 这样简单的主谓宾句子。而实际上,这个句子可以由图来表示,其中主语(“我”)和宾语(“你”)是节点谓语(“爱”)就是,即表示主语对宾语的关系。当然,对于复杂的句子,关系会更复杂一些,对应的图也就更复杂,但总归可以用图、节点、边来表示各个词语之间的关系。


下图表示的是 "Susan might not believe you" 这个句子的图,它是一个树状结构(Tree Structure)。而(Tree)也是一种图,它是一种特殊结构。


natural-language-graph


现在很火的翻译软件、语音识别、聊天机器等,背后的自然语言处理(Natural Language Processing)技术都来自于图论。


思考题:程序代码(例如 Python)可以用图论处理么?


人工智能


最近一段时间,人工智能(Artificial Intelligence)技术大红大紫,其中核心技术来自于深度神经网络(Deep Neural Network),即神经网络(Neural Network)的一种特殊形式。而神经网络的概念,简单可以理解为由神经元组成的大脑神经网络类似的结构。大脑中些神经元的电信号会通过神经网络传递到其他神经元,从而产生意识、想法、认知等抽象概念,而这背后的逻辑非常简单,就是电信号触发,只不过数量极为庞大。而如今深度神经网络的成功,也受益于计算机上搭建的大规模神经网络运算系统。全球著名人工智能公司 OpenAI 的 GPT-3 语言模型,由 1750 亿个参数组成,这已经接近成人大脑神经元数量级了。


万物皆图论


图论的概念非常简单,就像物理世界中的原子、分子、化学键这样的抽象概念,很容易在数学上进行处理。因此,大到全球互联网,小到蛋白质分子结构,图论在真实世界中的绝大部分领域都可以广泛得到应用。因此,学习好图论,对我们在工作生活学习中解决真实问题有非常大的帮助。例如,最优时间安排问题,就可以用图论来建模;而白领们常用的透视表,同样可以用图论中的二部图来处理。最近,笔者也在试着将图论应用到智能网页信息提取技术。学习图论有助于帮助我们更好的理解这个世界,从而可以更加合理的处理好我们自己的生活和工作。


社区


如果您对笔者的文章感兴趣,可以加笔者微信 tikazyq1 并注明 "码之道",笔者会将你拉入 "码之道" 交流群。


作者:MarvinZhang
链接:https://juejin.cn/post/7189897092238671928
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

0 个评论

要回复文章请先登录注册