火狐官方站点
火狐官方站点

【AI新星系列报道之四】方一向:让大模型生成更精准可靠


【AI新星系列报道之四】方一向:让大模型生成更精准可靠

来源:火狐官方站点    发布时间:2025-03-04 14:13:53

  2025年,香港中文大学(深圳)站在了新十年的起点上,作为中国高等教育综合改革的先锋,这座扎根大湾区,面向世界的年轻学府,在人工智能(AI)领域积累了深厚的科研实力与实践经验,自2014年建校之初,香港中文大学(深圳)便将AI列为战略核心,建立了“基础研究+技术攻关+成果产业化+人才支撑”的创新生态链,目前已打造国际一流科研平台100多个。2016年,大学率先成立机器人和AI制造国家地方联合工程实验室和深圳市大数据研究院。2019年,该实验室升级为深圳市AI与机器人研究院,与深圳市大数据研究院被正式授牌成为深圳市十大基础研究机构,这些科研平台的建立为学校在AI领域的持续创新奠定了坚实基础;十年间,大学在AI领域引进了包括全球高被引科学家和全球2%顶级科学家在内的全球顶级科学家团队,推动了AI领域的跨越式发展;与此同时,学校承担了多项国家重点研发计划和国家自然科学基金项目,并在国际科学技术领域斩获重要奖项,大学的机器人学科在CSRankings机器人领域连续十年被评为中国第一。

  在这片创新沃土之上,一批在AI领域崭露头角的青年学者脱颖而出,他们在多个前沿研究方向取得了重大突破。例如:可以跨尺度微无创介入的手术机器人——微纳机器人;可以自主适应复杂未知环境、智能应对多样化任务场景的通用变形机器人;化学材料领域的AI导师系统;中国首个医疗领域的大型语言模型华佗GPT,成为首个通过国家药剂师资格考试的医疗大型语言模型;融合卫星遥感与企业数据,为“双碳”战略提供高精度决策支持的国内首个碳数据库……

  除此之外,这些青年学者的研究领域涵盖了机器人学、人工智能、计算机视觉、物联网等多个学科,具体涉及多机器人系统、模块化机器人、群体智能、智能低碳、微/纳米机器人、医疗机器人、软体机器人、智能材料、生物特征识别、特种机器人、无人驾驶、海洋机器人、机器人控制等前沿研究方向。

  即日起,我们将推出“AI新星”系列专访,深入报道这些青年学者的研究经历与核心成果,讲述他们如何以创新思维应对国家重大需求与行业挑战。“AI新星”系列不仅是大学创新基因的缩影,更是中国AI迈向世界舞台中央的生动注脚。

  在图计算领域和AI的交汇处,方一向教授为计算机科学领域带来了突破与革新。他与华为、字节跳动等科技巨头合作,将研究成果应用于实际产业中,助力大模型精准生成的新纪元;他在理论上革新了算法范式,实现了性能百万倍的提升,赢得国际同行的广泛赞誉。同时,方一向教授是香港中文大学(深圳)程序设计竞赛队的领航者,他指导的团队在国内外赛场上大放异彩,屡创辉煌,成功培养了一批批计算机科学领域的未来之星。

  大语言模型已在众多领域展现出令人瞩目的能力,但它在处理特定领域查询问题时仍存在生成内容不正确或“幻觉”、信息过时、缺乏专业领域知识、更新训练代价高等一系列问题。为此,检索增强生成(Retrieval Augmented Generation,下称 RAG)技术应运而生,它通过引入外部知识图谱检索来指导大模型生成,从而大幅度的提高生成内容的准确性、可靠性、即时性。在这一背景下,方一向教授提出将知识图谱稠密子图搜索引入RAG技术,并做了大量的基准评测工作,提升了大模型回答问题的准确性、可靠性、时效性。

  方一向教授将这项研究成果应用于解决国民经济与社会持续健康发展中的实际问题,他与华为云PaaS-DevAI Lab紧密合作,为企业的生产研发提供了创新性的解决方案。此外,方一向教授还提出了知识图谱构建技术,他主持的“面向研发数据的知识图谱建构技术探讨研究”荣获2022年度CCF-华为胡杨林基金-软件工程专项基金资助。该项目从20多所高校与研究所的47项有效项目中脱颖而出,最终成为8项获批项目之一。项目针对结构化、半结构化、非结构化等形式的研发数据,通过实体和关系的识别、实体消歧和关系补全三个方面,为华为提供一整套的针对研发数据的知识图谱构建技术。

  使用图建模业务场景并解决实际问题在工业界越来越普及。作为图数据中的重要组成部分,稠密子图由一些紧密相连的节点所构成,可以大范围的应用于社交领域的社群发现、推荐领域的兴趣圈层挖掘、风控领域的异常团伙挖掘等领域。然而,目前大部分稠密子图挖掘相关工作专注于静态图数据,难以适用于动态网络,存在适用性差、准确率不高、效率低等一系列问题。在时序图中,通过考虑数据的时序性,可以挖掘出更深层的动态稠密子图,以帮企业追踪感兴趣的子图结构随时间的演化情况。该技术可用于社交网络分析与营销,如优化个性化推荐和识别异常行为。基于这一背景,方一向教授和字节跳动合作提出基于Leiden算法的高效动态社区挖掘算法,能够迅速地处理工业级大规模动态图数据(包含上亿节点或边的大规模图),助力企业解决动态社区挖掘难题。

  作为图计算领域的经典研究课题之一,最密子图挖掘问题已历经了近40年的研究历程,其在异常检测、社区检测、图可视化、图索引构造、生物网络分析等众多领域的广泛应用,始终吸引着学术界的高度关注。然而,该问题的求解算法时间开销非常大,自1984年后鲜有重大突破,严重制约了最密子图在大规模图数据上的应用。

  方一向教授的研究为这个困局带来了突破性的进展,为提升最密子图挖掘的效率,他创新性地提出一种基于k-core的全新求解范式。该范式通过推导k-core的密度理论上下界,把最密子图锁定在图中特定的k-cores中,避免从全图中求解最密子图,大幅加速最密子图挖掘的过程。基于这一新范式,方教授设计了针对有向图的高效最密子图挖掘算法,经过大规模有向图实验验证,新提出的算法较当时最优算法的性能提升高达6个数量级。这项突破性研究成果在数据库顶级会议SIGMOD 2020上进行发表,从458篇论文中脱颖而出,被评选为SIGMOD 2020会议的4篇最佳论文之一,并斩获2021 ACM SIGMOD Research Highlight Award——数据库领域的顶尖荣誉之一,代表了数据库研究领域的顶配水平。数据库领域资深学者、ACM Fellow、IEEE Fellow、ACM杰出科学家陶宇飞教授高度评价此项成果,称其为“一项理论与实践完美融合的出色研究”。

  在精研学术与反哺产业之外,方一向教授作为港中大(深圳)程序设计竞赛队的指导老师,带领团队与全球顶尖高校的优秀选手同场竞技,在激烈的竞争中取得令人瞩目的成绩。2024年,方教授指导的团队斩获12金2银5铜的骄人成绩,并两度入围ICPC国际大学生程序设计竞赛世界总决赛。在第48届ICPC世界总决赛中,团队以全球第40名、东亚区第8名的优异成绩刷新队史成绩,解题数量与斯坦福大学、香港中文大学、上海交通大学等国内外知名高校并列。截止至2024年年底,竞赛队共计获得31个金奖、27个银奖、15个铜奖,充足表现了学校在培养国际化高素质人才方面的卓越成果,彰显了方教授及其团队日益增强的国际竞争力。

  方一向教授不仅在竞赛指导上展现了卓越的能力,在竞赛平台搭建、人才梯队建设、本科生招生、企业合作衔接及基础教育服务等方面同样倾注了大量心血,还讲授本科生《数据结构》和博士生《算法分析》等AI核心基础课程,致力于为学生打下坚实的编程与算法基础,以培养其卓越的专业能力。方一向教授还带领竞赛队成功举办了2023年、2024年两届港中大(深圳)程序设计竞赛,积极推动了编程竞赛在校园及附属学校等大学辐射范围内的普及化和全民化,为AI领域的人才培养树立了新的标杆。

  竞赛或许可以不是目的本身,但通过一系列校内外编程活动,像“全民乒乓球运动”一样吸引全校大学生热情参加编程,可以在一定程度上完成“以赛促学”、“以赛促研”,以竞赛促进计算机和人工智能教育水平的提高,帮助学生在学术研究、科学技术创新等路径探索更多的人生可能性,这是方教授作为一名学者对后辈青年人的关切与支持。

  方一向,香港中文大学(深圳)数据科学学院副教授,香港中文大学(深圳)程序设计竞赛队伍指导老师,主要研究大数据管理、挖掘、人工智能等相关课题,具体包括面向大规模图数据的数据管理、数据挖掘、图神经网络、表达学习等,以及大模型和图数据结合的相关研究课题。在数据库、数据挖掘、人工智能等领域的国际顶级会议/期刊(如VLDB、SIGMOD、ICDE、NeurIPS、、IJCAI、TODS、VLDBJ、TKDE等)上累计发表论文100余篇,包括中国计算机学会认定的A类论文(即CCF-A)将近70篇,第一/通讯作者CCF-A论文将近50篇。其中一项代表性研究成果的论文被评为SIGMOD 2020会议的最佳论文之一(~4/458),并荣获2021 ACM SIGMOD Research Highlight Award。目前担任国际知名期刊《Information Processing & Management》(CCF-B类期刊)的编委,担任多个数据库和数据挖掘领域顶级会议(例如PVLDB、ICDE、KDD、AAAI、IJCAI等)的程序委员会成员以及顶级期刊(例如TKDE、VLDBJ等)的审稿人,中国计算机学会数据库专业委员会的执行委员。

上一篇:项目管理软件哪家强?好用软件背后的真相

下一篇:7x7x任意燥众乐乐V

火狐官方站点