一些人工智能导论概念
第一章-概论
(1)什么是人工智能?人工智能的近期、远期研究目标是什么?
人工智能(Artificial Intelligence,AI),又称机器智能(Machine Intelligence,MI),主要研究用人工的方法和技术开发智能机器或智能系统,以模仿、延伸和扩展人的智能、生物智能、自热智能,实现机器的智能行为。
人工智能定义可以粗略概括为:用机器模拟或实现人类智能。
人工智能的近期目标是实现机器智能,即研究如何使现有的计算机具备更高的智能,在一定领域或在一定程度上去完成需要人的复杂脑力才能完成的工作。已经大量应用于各个领域:模式识别、智能决策等。
人工智能的远期目标是要制造智能机器,即探索智能的基本原理,研究使用各种机器、各种方法模拟人的思维过程或智能行为,最终制造出和人有相似或相近智力水平和行为能力的综合智能系统。一个个近期目标实现的“量变”必将带来远期目标实现的“质变” 。
(2)何为智能?
- 从微观层面,人的智能产生于人的大脑 ,而人脑是一个由10^11~10^12个神经元连接形成的巨系统,结构和活动规律都极其复杂。
- 从宏观层面,智能系统通常包括感知、记忆与思维、效应三大部分。
- 从知识工程角度认识智能
- 内涵上: 智能 = 知识 + 思维;
- 外延上: 智能就是获取知识、处理知识、运用知识的能力。
- 广义智能观,智能广泛存在于自然界中。
- 依靠自然智能机制的模型计算,促进了广义人工智能的形成。
(3)人工智能的三大研究学派、途径与方法?
传统划分方法:符号主义学派、连接主义学派和行为主义学派。
①符号主义学派(Symbolicism):以人脑的心理模型为依据,将问题或知识表示成某种符号,采用符号推演的方法,宏观上模拟人脑的推理、联想、学习、计算等功能。
②连接主义学派(Connectionism):以人脑的生理模型为依据,通过对生物神经结构的模拟,实现学习、记忆、联想、计算和推理等功能,从而模拟人脑的智能行为。
③行为主义学派(Actionism):模拟人在控制过程中的智能活动和行为特性,如自适应,自寻优、自学习、自组织等,以此来研究和实现人工智能。
现代划分方法:符号智能流派、计算智能流派和群体智能流派。
①符号智能流派:对智能和人工智能持狭义的观点,侧重于研究任何利用计算机软件来模拟人的抽象思维过程,并把思维过程看成是一个抽象的符号处理过程。
②计算智能流派:依靠数据计算解决问题,是连接主义、行为主义、进化计算、免疫计算和模糊计算等学派的统称。
③群体智能流派:用生态系统的观点看待智能,智能表现在群体的整体特性上,群体中每个个体的智能虽然很有限,但通过个体之间的分工协作和相互竞争,可以表现出很高的智能。
(4)人工智能的基本技术有哪些?
三大基本技术:知识表示技术,知识推理、计算和搜索技术,系统实现技术。
①知识表示技术:研究各种知识的形式化方法,并要求所采用的形式化方法能够便于知识在计算机中进行存储、组织,便于问题求解中的检索、推理等操作,包括知识的逻辑表示、图形表示及各种结构化表示等。
②知识推理、计算和搜索技术:研究各种问题的求解规律和设计可机械执行的智能算子,用以实现问题求解过程。具体包括推理技术、搜索技术、归纳技术、联想技术、知识发现、模式识别、机器学习、智能计算等。
③系统实现技术:研究如何实现相关知识的计算机内部表示,将各种智能算子或求解过程转换为程序。对智能应用系统,还要特别考虑人机交互及界面的实现,即把各种有关的知识组织成一个有效的智能问题求解系统,以便在计算机上实现问题的自动求解。
(5)人工智能的分支领域(基于应用领域)
人工智能主要研究领域:
- 博弈
- 专家系统
- 模式识别
- 机器学习
- 计算智能
- 自然语言处理
- 自动定理证明
- 分布式人工智能
- 机器人
①博弈
博弈(Game Playing)可泛指单方、双方或多方依靠“智力”获取成功或击败对手获胜等活动过程。
博弈问题的求解通常是一个搜索过程。
博弈中的很多概念、方法和成果对人工智能的其他领域提供了极具价值的参考和指导。
②专家系统
专家系统(Expert System)是一种智能计算机系统,在一定程度上辅助、模拟或代替人类专家解决某一领域内的问题,可以达到甚至超过人类专家的水平。
辅助、模拟或代替人类专家解决某一领域问题。
专家系统的成功源于专门知识在智能模拟中的重要作用。专家系统是基于知识的智能问题求解系统。
③模式识别
模式识别(Pattern Recognition )指的是用计算机进行物体识别。这里的物体一般指文字、符号、图形、图像、语音、声音及传感器信息等形式的实体对象,也就是说,这里所说的模式识别是狭义的模式识别,它是人和生物的感知能力在计算机上的模拟和扩展。
研究人和生物感知能力在计算机上的模拟和扩展。
模式识别的应用主要有:
- 文字识别
- 语音识别
- 指纹识别
- 图像识别
- 遥感
- 医学诊断
④机器学习
机器学习(Machine Learning)研究:如何使机器通过经验来改善、提高其自身性能。具体地说,研究用计算机模拟或实现人类的学习能力,使其解决某一问题的水平不断提高。
研究计算机模拟或实现人类学习能力。
机器学习是人工智能的高级课题,同时也是众多相关研究领域的基础。
⑤计算智能
计算智能(Computational Intelligence)也称自然智能(或自然计算):是基于“从大自然中获取智慧”的理念、受到大自然智慧和人类智慧的启发而设计出来的一类算法的统称。
基于从大自然中获取智慧的理念,设计的算法的总称。
实现对实际问题的优化求解,在可接受的时间内求出可以接受的解。
-
模仿生物界的优胜劣汰进化过程(遗传算法)
-
模仿生物的生理构造和身体机能(人工免疫算法)
-
模仿动物的群体行为(蚁群算法、人工粒群算法那、狼群算法)
-
模仿人类的思维、语言和记忆过程的特性(禁忌搜索)
-
模仿自然界的物理现象(模拟退火算法)
⑥自然语言处理
自然语言处理(Natural Language Processing,NLP) :包含自然语言理解及自然语言生成。
自然语言系统不是一个形式语言系统,因此对自然语言理解和自然语言生成,都是十分困难的。
包括计算机理解自然语言或用自然语言来表达意图。
NLP应用:
-
自然语言交互、聊天机器人。
-
导购、下单、客服。
-
自动写作,新闻、诗歌、对联。
-
文字、图像、视频、音乐等多模态关联生成。
-
智能搜索、情感分析、意见挖掘、舆情监测。
-
自动阅读,问题回答。
-
推荐系统,新闻、会议、论文、商品等。
-
电子医生、电子律师、智能教育、金融预测、…
-
实时场景同传翻译…
⑦自动定理证明
自动定理证明(Automated Theorem Proving,ATP):自动定理证明是人工智能研究领域中的一个非常重要的课题,其任务是对数学中提出的定理或猜想寻找一种证明或反证的方法。
研究非数值领域的逻辑推理问题。
⑧分布式人工智能
分布式人工智能(Distributed Artificial Intelligence,DAI),是在分布式问题求解(Distributed Problem Solving,DPS)的基础上发展而来的。它的产生一方面得益于计算机网络、并行计算、分布式处理和人工智能等相关技术的飞速发展,另一方面是由于单个的集中式系统无法充分利用在时空上分布的各种资源,无法解决分布式环境下的各种实际问题。分布式人工智能系统具有分布性、连接性、协作性、开放性、容错性等特点。
DAI大约可划分为三个基本范畴:一是多Agent系统(Multi-Agent System,MAS);二是分布式问题求解(Distributed Problem Solving,DPS);三是并行人工智能(ParallelArtificial Intelligence,PAI)。随着Agent技术的发展,MAS成为分布式人工智能研究的热点,为分布式人工智能系统的研究和应用开辟了新的途径,更有人认为,MAS就是分布式人工智能系统。
⑨机器人
机器人(Robot)是人工智能的一个综合研究和应用场所。
机器人定义:一种可编程和多功能的的操作机;或是为了执行不同的任务而具有可用电脑改变和可编程动作的专门系统。 —— 美国机器人协会
人工智能的综合应用及研究。
智能机器人的研究几乎用到人工智能的所有技术,是一个交叉性、综合性和挑战性很强的领域,它的应用也普及到各个角落。
按照其智能程度来划分,大致可分为:
- 操作型
- 程控性
- 示教再现型
- 数控型
- 感觉控制型
- 适应控制型
- 学习控制型
- 智能型
(6)人工智能何时、何地、怎么诞生?发展史
诞生:1956年夏季,十位来自数学、心理学、神经生理学、信息论和计算机方面的专家在美国达特莫斯大学召开一次历时两个月的研究会,讨论了关于机器智能的有关问题,会上麦卡锡提议正式采用了“人工智能”一词,标志人工智能学科的正式诞生。
发展史:
书上:
- 推理期
- 知识期
- 学习期
PPT:
(7)“知识工程”是在什么背景下提出来的?对人工智能的发展有何重要作用?
经过对前一段研究工作中经验和教训的总结,以美国斯坦福大学E. A. Feigenbaum为首的科学家力排众议,积极提倡人工智能应该由实验室走向实际应用。专家系统 DENDRAL的成功实现,为人工智能开辟了新的领域,也带来了新的活力。在继一大批专家系统成功研制之后,E. A. Feigenbaum 提出了“知识工程”的概念,使人们更加清楚地认识到,问题的智能求解过程就是一个知识处理过程,标志着人工智能的研究从以推理为中心转向以知识为中心,进入知识期。
20世纪 80年代后。专家系统与知识工程在理论、技术应用方面都有较快的发展。应用于不同领域的专家系统不断涌现并投入到实际应用中;专家系统的建造也从原有基于程序设计语言的开发转向基于外壳和采用开发环境进行开发的阶段;专家系统的规模在不断扩大,结构不断变化,出现了各种新型的专家系统;知识表示、不确定性推理等方面都取得重大进展,另外还出现了基于知识的系统和知识库系统。专家系统、知识工程的技术已经应用于各种计算机应用系统。
(8)人工智能的最新代表性研究成果及其意义、对人类的影响
自然语言处理(NLP)的进步 - GPT-4的推出:
- 成果意义:GPT-4作为新一代大型语言模型,相比之前的版本在生成文本的连贯性、创造性以及跨领域的专业知识上有显著提升。它在语言理解和生成任务上达到了新的高度,不仅能够应用于日常对话系统,还能在法律、医疗等专业领域提供辅助决策和内容生成,展现了AI在高技能工作中的潜在应用。
- 对人类的影响:GPT-4的出现加速了自动化文档处理、客户服务、教育辅导等领域的变革,提高了效率和个性化水平。同时,它也引发了关于AI取代人力、内容真实性以及AI伦理的广泛讨论。
SORA - 革命性的文本到视频生成技术
- 成果意义: SORA标志着AI生成技术的一个里程碑式跃进,它能够将文本描述直接转化为流畅、高分辨率的视频内容,涵盖从脚本构思到最终成片的全过程。这一技术利用深度学习和生成模型的最新进展,不仅在视觉效果上实现了逼真度与创意表达的高度统一,还能够理解并体现文本中的情感色彩与细微意图,为数字内容创造开辟了前所未有的疆域。
- 对人类的影响:SORA的出现加速了自动化视频制作、在线教育、个性化广告等领域的变革,提高了效率和个性化水平。同时,它也引发了关于AI取代人力、内容真实性以及AI伦理的广泛讨论。
(9)人工智能发展的最新、最典型代表是什么?为什么?
我认为至今人工智能发展的最新、最典型代表是通用人工智能(Artificial General Intelligence, AGI)。通用人工智能是指具有广泛适用性和强大学习、适应能力的AI系统,它能够执行不限于特定任务的多种职能,模仿人类的智力灵活性,处理未见过的问题,并在不同领域间迁移知识。
朱松纯教授提出的观点强调了通用人工智能作为新质生产力的典型代表,指出其已经成为全球科技竞争的关键领域。他认为,真正的通用人工智能应满足能在无限任务中工作、在场景中自主发现任务并由自我价值驱动等条件。朱松纯回国后,在北京大学和清华大学开设通用人工智能实验班,并推动了“通计划”,联合多所院校共同培养这一领域的高端人才,体现了国家层面对通用人工智能研究的重视和支持。
通用人工智能之所以被视为最新且典型的代表,是因为它不仅标志着技术上的巨大飞跃,预示着人工智能从“狭义”向“广义”的转变,还因为它对经济、社会乃至国家安全具有战略意义。随着技术的不断进步和应用场景的拓宽,通用人工智能有望成为推动各行各业转型升级的核心驱动力,解决复杂问题,创造前所未有的价值。同时,它也带来了对伦理、法律、就业结构等多方面的深刻影响与挑战,是当前人工智能领域探索的最前沿。
第二章-基于图的知识表示与图搜索技术
(1)状态图知识表示
状态空间(State Space)
问题的状态空间是一个表示该问题全部的可能状态及相互关系的图。
一般用赋值有向图,包含:
- S:问题的可能有的初始状态的集合;
- F:操作的集合;
- G:目标状态的集合。
- 状态空间常记为三元序列<S,F,G>。
(2)与或图
本原问题:直接可解的问题。
终止节点:本原问题对应的节点。
端节点:无子节点的节点。
与节点:子节点为与关系的节点。
或节点:子节点为或关系的节点。
(3)OPEN表和CLOSED表的作用
OPEN表:动态数据结构,登记记录当前待考察的节点。
CLOSED表 :动态数据结构,记录考察过的节点。
(4)深度优先和广度优先搜索的优缺点
深度优先效率高,可能进入无限分支,在问题有解的情况下可能找不到解,并且不能保证是最优解。
广度优先效率低,但是如果问题有解,一定能找到解,而且是最优解。
(5)盲目搜索及其特点
无向导的搜索,也称穷举搜索。
在搜索过程中,没有任何背景知识作指导,不考虑任何与解有关的信息,随机地按预先规定的顺序(如广度优先和深度优先)机械地生成树的节点,并判断是否为解,直到找到解或证明问题无解为止。
具有通用性,效率低,实际问题中往往不可行。
(6)什么是启发函数?什么是启发式搜索?有什么特点?
启发函数:要实现启发式搜索,需要把启发性知识形式化,即用一定的函数表示出来,并通过函数计算来评价每种选择的价值大小,用以指导搜索过程。
启发式搜索:利用“启发性信息”作为导航的搜索过程。
“启发性信息”就是与问题有关的、有利于尽快找到问题的信息或知识,如待解问题解的分布规律、求解该问题的经验、窍门等(博弈、机器学习、数据挖掘、智能检索等)。
问题相关,实际问题中广泛应用。
第三章-基于谓词逻辑的知识表示与机器推理技术
归结策略
- 简化性策略
- 删除策略(删除新生成的类含于已有的)
- 限制性策略
- 支持集策略(至少有一个非G中或者后裔的子句)
- 线性归结策略(必须有一个是推出的)
- 祖先过滤型策略(要么至少有一个是原始子句集中的,要么一个是另一个祖先)
- 语义归结策略
- 有序性策略
- 单元归结策略(必须有一个单元子句)
第四章-不确定性知识的表示与推理技术
(1)不确定性类型及特点
不确定性:知识和信息中含有的不肯定、不可靠、不准确、不精确、不严格、不严密、不完全甚至不一致的成分。
按产生原因及表现形式分类:
- 随机不确定性
- 模糊不确定性
- 不完全性
- 不一致性
①随机不确定性
随机不确定性是基于概率的一种衡量,即已知一个事件发生有多个可能的结果。虽然在该事件发生之前,无法确定哪个结果会出现,但是,可以预先知道每个结果发生的可能性。
例如:
“这场球赛甲队可能取胜。”
“如果头疼发烧,则大概是患了感冒。”
②模糊不确定性
模糊不确定性就是一个命题中所出现的某些言词其涵义不够确切,从概念角度讲,就是其代表的概念的内涵没有硬性的标准或条件,其外延没有硬性的边界。
例如:
“小王是高个子。 ”
“张三和李四是好朋友。 ”
把涵义不确切的言词所代表的概念称为软概念。
③不完全性
对某事物了解得不完全或认识不够完整。
例如:
刑侦过程的某些阶段往往要针对不完全的证据进行推理。
④不一致性
随着时间或空间的推移,得到了前后不相容或不一致的结论。
例如:
人们对太空的认识等。
(2)不确定性推理中要解决哪些基本问题
要解决的基本问题:
- 不确定性的表示与度量
- 不确定性的匹配算法
- 不确定性的计算与传播
注:确定性理论和证据理论解决随机不确定性,模糊推理解决模糊不确定性。
第六章-机器学习
(1)学习与机器学习的定义
学习:系统在不断重复的工作中对本身能力的增强和改进,使得系统在下一次执行同样任务或类似任务时会比现在做得更好或效率更高(西蒙)。
机器学习:实现通过经验来提高对某任务处理性能的行为的计算机程序。
形式化的定义:针对某类任务T,如果计算机程序用P衡量的性能根据经验E不断自我完善,那么,称这个计算机程序针对某类任务T从经验E中学习,它的性能衡量标准为P(Tom Michell)。
机器学习系统的要素:学习任务、学习经验、性能评价标准、学习机制或算法。
(2)基本结构
note
环境:提供外界信息,类似于教师的角色【选择训练经验或训练数据,根据训练数据是否包含导师信号(答案),分为:有指导学习(监督学习);无指导学习(无监督学习);强化学习(增强学习)】。
学习环节:处理环境提供的信息,并接受执行环节的反馈信息,以便得到并改善知识库中的知识,直到满足性能标准,相当于各种学习算法。(是机器学习的核心,不同的学习算需要不同的环境信息,也会产生不同的知识形式。如遗传算法、神经网络的BP算法、最小均方算法、CNN、RNN、Transformaer 等)
知识库(可换为模型):即学习到的知识,通常是学习的目标函数的逼近,以某种知识表示形式存储学习到的知识(样例:概念学习:规则;决策树学习:决策树;神经网络学习:网络拓扑及权值参数)。
执行环节:利用知识库中的知识完成某种任务,目的是测试所学习到的知识的性能,并把执行中的某种情况回送给学习环节(进行评价)。进一步可以运用所学知识解决实际问题。引入各种评价指标,评价算法的性能。
(3)基于学习方式的分类
有指导学习(监督学习):输入数据中有导师信号,以概率函数、代数函数或人工神经网络为基函数模型,采用迭代计算方法,学习结果为函数。
无指导学习(非监督学习):输入数据中无导师信号,采用聚类方法,学习结果为类别。典型的无导师学习有发现学习、聚类、竞争学习等(K均值聚类)。
强化学习(增强学习):以环境反馈(奖/惩信号)作为输入,以统计和动态规划技术为指导的一种学习方法(相似的样本,拥有相似的输出)。
第八章-自然语言处理
(1)自然语言的特点
- 自然语言的表达非常灵活,很难完全形式化
- 自然语言充满歧义,很难完全消解
- 自然语言中有各种语言创新,机器很难应付
①自然语言的表达非常灵活,很难完全形式化
如下面例子中,“主席团”、“台上”、“坐”可以随便调换次序,但都表达相同的意思。
- 主席团台上坐。
- 主席团坐台上。
- 台上坐主席团。
- 台上主席团坐。
还有各种各样的省略形式。
- 如:今天星期五。
- 两个词语就构成一句话,省略了谓语“是”。
②自然语言充满歧义,很难完全消解
- 读音歧义
- 分词歧义
- 词性歧义
- 句法结构歧义
- 词义歧义
1)读音歧义
- 朝阳(zhaoyang)产业
- 北京市朝阳(chaoyang)区
2)分词歧义
- 南京市长江大桥。
- 白天鹅在湖里游泳。
3)词性歧义
- 这只会测水温的鸭子,挺有用的。
- 这只会测水温的鸭子,没什么用。
4)句法结构歧义
- 咬死了猎人的狗。
- 三个大学的老师。
5)词义歧义
他说:“她这个人真有意思(funny)。”
她说:“他这个人怪有意思的(funny)。”
于是人们以为他们有了意思(wish),并让他向她意思意思(express)。
他火了:“我根本没有那个意思(thought)!”
她也生气了:“你们这么说是什么意思(intention)?”
事后有人说:“真有意思(funny)。”也有人说:“真没意思(nonsense)。”
——《生活报》1994. 11. 13. 第六版
③自然语言中有各种语言创新,机器很难应付
- 隐喻、借代、双关、幽默等
- 知识的海洋
- 历史的舞台
- 双关
- 天大药业的广告词:您的健康是天大的事。
- 昂立教育:ONLY education can change your life.
- 拉着胡子上船——牵须过渡(谦虚过度)。
(2)什么是自然语言处理?
指用计算机来分析、处理自然语言,让计算机理解并能表达自然语言,实现人与计算机的自然语言交流(IBM Watson核心)。
(3)自然语言处理涉及的层次(语言有语音和文字两个属性)
- 语音分析
- 词法分析
- 句法分析
- 语义分析
- 语用分析
①语音分析
语义分析是相对独立的模块,包括声音到文字的转换、文字到声音的转换、声音信号的处理等方面。
声音到文字的转换称为语音识别。
文字到声音的转换称为文语转换或语音合成。
②词法分析
词语是能够独立运用的、有意义的最小的语法单位。
词法分析确定组成句子的词语及词性信息。
汉语分词方法
- 基于词的方法(与已有的词表进行匹配)
- 基于字的方法(根据字在词中的位置进行标记,然后扫描)
③句法分析
句法是描述词语怎样组成短语、进而组成句子的法则。通过句法分析,可以判断一个句子是否合法。
④语义分析
语义分析是确定文字所表达的意思,从确定单个词语的意思开始,得到整个句子及篇章的意思。
⑤语用分析
语用即语言的使用。语用分析就是结合语境知识来更充分地理解语言的含义。
词义消歧
一词多义很常见。
根据上下文语境自动确定词语用的是哪一个义项。
例如,“仪表”这个词在《现代汉语词典(第5版)》中有两个义项:
- 人的外表(包括容貌、姿态、风度等,指好的):~堂堂
- 测定温度、压力、电量等各种物理量的仪器。
词义消歧是确定下面两句话中的“仪表”分别属于哪一个义项。
- 我国仪器仪表事业取得了长足的发展。
- 酒店要求服务员仪表端庄大方。
词义消岐通常需要词义知识库的支持,以说明词语有几个义项。
基于统计/深度学习的词义消岐还需要词义标注语料库的支持。
语义角色标识
浅层语义分析,标注谓词(谓语动词、名词、形容词) 的语义角色。
语义角色指有关语言成分的所指在语句所表达的事件中所扮演的参与者角色。
常见的语义角色类型有施事、受事、与事、工具、方式、时间、处所、结果、目的、原因等。
例如:
昨天张三在家吃苹果。
谓语动词“吃”的语义角色有:施事-张三,受事-苹果,时间-昨天,处所-家。
标注了谓词的语义角色,就在一定程度上达到了对句子的理解。
语义角色标注可以分成两个步骤:
- 找出句子中哪些词充当谓词的语义角色;
- 确定这些词的语义角色类型。
(4)语言知识库
语言知识库是把人类的语言知识组织起来,供计算机程序使用。
语言知识库是自然语言处理的数据基础,直接决定着自然语言处理系统的成败。
根据语言知识的层次不同,语言知识库可以分为语法知识库和语义知识库。
语法知识库:现代汉语语法信息词典。
语义知识库:HowNet(语义网络→知网)。
集词典、规则、语料库于一体的语言知识库——现代汉语虚词用法知识库。
(5)自然语言处理的应用
- 语音识别和合成
- 机器翻译
- 信息检索
- 问答系统
- 信息抽取
- 文本摘要
- 文本分类
- 社会计算
(6)为什么说NLP是人工智能领域皇冠上的明珠?
important
自然语言处理有助于打破人与机器之间的障碍,改善人机交流的效率和生产力。在人工智能出现之前,机器只能处理结构化的数据,例如Excel里的数据;但是网络中大部分的数据都是非结构化的,例如:文章、图片、音频、视频等,在非结构数据中,文本的数量是最多的,虽然没有图片和视频占用的空间大,但是文本的信息量是最大的,为了能够分析和利用这些文本信息,我们就需要利用NLP技术,让机器理解这些文本信息,并加以利用。自然语言处理就是在机器语言和人类语言之间沟通的桥梁,以实现人机交流的目的。如果语言智能能够突破,与它同属认知智能的知识和推理就会得到长足的发展,整个人工智能体系就会得到很好的推进,也有更多的场景可以落地。