中意知识网 中意知识网

当前位置: 首页 » 常用知识 »

AI赋能千行百业,传统文科怎么变?

2023年是人工智能(AI)大模型元年。2024年,AI技术持续高速发展,在脑机接口、医疗、自动驾驶、机器人、量子计算等领域取得突破性创新。

向外看世界,2024年诺贝尔物理学奖和化学奖都授予了AI大咖,其中,化学奖得主利用阿尔法折叠预测了2亿多个蛋白质的可能结构,解决了“太阳底下最难的科学问题”之一,而且还预测,10年之内AI会协助人类攻克各种疾病。

向内看中国,AI赋能下的科技创新正全面爆发,尤其是DeepSeek的横空出世,极大地提升了中国科技创新的信心和动力,使得AI完成了一次全民科普。当AI重塑千行百业之时,人文社会科学自然不能例外。

数字人文拓展诸多新概念

说到AI,先要提到数字人文。计算机技术应用于人文社科研究,可以追溯到1949年。当时,意大利耶稣会神父罗伯特·布萨率团队用IBM计算机花费了30年左右,到1980年编成了56卷百科全书式的托马斯著作索引。20世纪末,美国的一些研究机构开始使用数字人文,到2024年《数字人文指南》一书诞生,这个名称正式确定。

目前,国际上的数字人文机构已有200多家,中国有70多家数字人文专门研究机构,另有30多家高校机构也积极开展数字人文交叉研究。

从研究角度看,近年来,数字人文拓展出很多新概念,如数字文化、数字史学、数字考古学、计算哲学等,此外还包括计算语言学和自然语言处理。计算语言学和自然语言处理萌芽于1940至1950年代,核心问题是语言的自动理解和生成。基础研究包括算法框架、知识图谱;应用研究也涵盖很多种类,其中就包含有古文字信息处理。

谷歌公司2017年推出的Transformer深度学习架构是算法框架上的突破;2018年推出的预训练语言模型BERT,在语言理解指标上超越人类。另一AI巨头OpenAI则从2018年起推出GPT系列模型。

在这样的影响下,中文语言大模型也层出不穷,例如通义千问、文心一言、智谱清言、百川等。同时,在垂类领域,还出现了很多古汉语语言模型、民族语言模型及古籍智能平台。

技术影响下的传统文科

谈到数字人文,也不得不说说AI与人文社科的关系。

其实,文学对AI的冲击更为敏感,文学家在AI面前越来越显得无奈。中文逍遥大模型基于创作者的想法灵感,能够一键生成万字、一张图写出一部小说,它能大幅提升创作者的效率,也具备一次读懂100万字小说的功能。虽然对文学创作来说,作者的个性思维是机器永远无法替代的,但是AI写作的《机忆之地》已在第五届江苏省青年科普科幻作品大赛评选中获得二等奖——这是人类作家用3个小时,与AI平台前后对话66次、形成4万多字的稿件后,从中复制5900多字形成的作品。

再以哲学为例。中国工程院院士李德毅2023年在《人工智能看哲学》一文中提出:“人工智能的飞速发展正深刻地改变着人类的生产方式、生活方式以及思维方式,没有哪门学科比人工智能更需要和哲学打交道。”2024年,日本名古屋大学团队利用生成式AI开发了一款可以与古希腊哲学家们进行对话的系统。

在历史学研究中,AI也有广泛应用。比如,通过综合运用数据挖掘、指标评价、可视化分析等技术,研究人员可基于历代《食货志》文本研究古代中国农作物的空间分布与集聚性特征;此外,通过AI制作复原的数字人,诸多历史人物得以“复活”,从教材中走出来,穿越到现实之中。

考古学对科技进展最为敏感,有两个案例令人印象深刻。其一是地质学家朱利安·汤普森团队2016年在学术期刊《科学》上发表的《公元前1920年的洪水爆发为中国传说中的大洪水和夏朝的存在提供依据》。他通过建立黄河流域数字高程模型,在郑州至开封段发现宽达30公里的古河道遗迹,证明在公元前1920年的前后20年间存在一场持续20年以上的超级洪灾,这正是大禹治水的现实背景。它不仅印证了《尚书》中“汤汤洪水方割”的记载,更意外触发了关于大禹治水技术体系的全球大辩论。另一个案例是2024年2月,谷歌旗下的DeepMind发布了一个根据互联网视频训练的基础世界模型——Genie(精灵),可从合成图像、照片、草图生成多种动作可控的环境。2024年底推出的新一代世界模型Genie2,则可根据一张图生成可供人类或AI智能体游玩的无限3D世界。这在考古发掘、历史场景复原方面,有极为可观的应用前景。

此外,AI在绘画、音乐、诗歌、电影、舞蹈、雕塑等艺术领域也展现出强大能力。2018年,首件AI生成作品《埃德蒙·贝拉米肖像》就被佳士得以43.25万美元拍出。

AI赋能古文字研究

再看笔者所熟悉的古文字研究领域,虽然我们是传统得不能再传统的人文学科,但近年来同样可以看到明显的AI赋能的进展。

近几年,国外在古典文字AI破译方面有很多新的突破。比如,DeepMind与威尼斯大学人文系、哈佛大学希腊研究中心、牛津大学古典学院和雅典经济与商业大学信息学系合作,共同推出名为“伊萨卡(Ithaca)”的深度学习模型,并将其用于修复古希腊受损的石碑铭文。另一个轰动学界的案例是,美国21岁的年轻科学家卢克·法里托将AI与超过阳光亮度数亿倍的X射线结合,由此成功解读出意大利赫库兰尼姆古城中被火山灰掩埋烧焦的莎草纸卷轴中的第一个完整单词“ΟΡΦΥΡΑ□”(意为“紫色”)。随后,卢克还与其他人合作分析出超过两千个字符,并认为这些内容与伊壁鸠鲁哲学有关。

这些案例都给古文字研究者带来启示。1973年河北省定县(今定州市)八角廊40号西汉墓中出土的竹简,由于墓葬被烧,导致竹简严重碳化、变形。以往,研究者采取的是通过红外照相和物理拉直的办法来整理资料并辨别竹简上的文字。现在,我们完全可以借用上述案例中辨别莎草纸的方式来提高整理质量。

据笔者所知,目前全国范围内,已有十个院校团队在从事古文字AI研究与开发工作,除复旦大学、清华大学、南京大学、华东师范大学等学校外,还包括三家河南的高校,因为河南是甲骨文的故乡。

目前已知现存的甲骨片的总数大约是有16万片,这16万片当中有很多都是残片、碎片。那么,如何把这些碎片拼合到原来牛骨和龟甲上?必须借助于AI。

清华大学的李霜洁研发了人工智能文物拼缀系统“知微缀”,其与复旦大学教授蒋玉斌、博士生杨熠等人合作,以AI引导人类直觉的交互方式,带动研究者高效发现甲骨新缀,目前已发现超过50组甲骨新缀成果。蒋玉斌承担的国家社科基金重大项目“人机协同的甲骨分类缀合研究”,目前甲骨缀合成果已超7000组,其中蒋玉斌缀合了500多组,杨熠缀合了400多组,两人缀合加起来共900多组,占学术界缀合总数的近七分之一。

古文字与AI的结合还包括图像校重、古文字单字识别、古文字图像文字识别、知识图谱、多模态数据集等。

当然,AI与人文学科的融合,目前尚处于初步阶段,AI生成内容在可信度、规范性上距离高质量的人文研究、教育和推广的需求还有很大差距。另一方面,由于人文学科专业领域知识库尚未形成规模,数据标准不统一,共享、整合的难度较大。加之跨学科人才培养,更是涉及招生、教学、就业以及评价机制各方面问题,这也带来人文研究“AI鸿沟”的凸显和加剧。

不过,即便如此,我们还是期待更多人文学者与AI双向奔赴,共同迎接AI赋能的人文学科研究的腾飞。

(作者为复旦大学文科资深教授,古文字研究中心主任)

未经允许不得转载: 中意知识网 » AI赋能千行百业,传统文科怎么变?