第二十八届全国信息检索学术会议 (CCIR2022)
特邀报告
特邀报告一(9月17日,9:00-10:00)
报告人:高新波
高新波,博士,教授,重庆邮电大学校长,国家万人计划科技创新领军人才,新世纪百千万人才工程国家级人选,教育部长江学者特聘教授(2012-2017),国家杰出青年科学基金获得者,重庆英才优秀科学家,科技部重点领域创新团队负责人、教育部创新团队负责人,教育部高等学校计算机类专业教学指导委员会委员。重庆市青年科技领军人才协会会长、英国工程技术学会会士、中国电子学会会士、中国计算机学会会士。主要从事人工智能、机器学习、计算机视觉、模式识别等领域的研究和教学工作,出版专著教材7部、发表学术论文300余篇,获国家创新争先奖状、国家自然科学二等奖1项、省部级科学技术一等奖5项。
报告题目:图像跨域重建理论与方法
报告摘要: 跨域图像,又成异质图像或跨模态图像,是指同一目标通过不同传感器所获得的不同形态的图像。而图像跨域重建则是指利用跨域图像之间的内容关联性和表达互补性,由一个域的图像生成另外一个域的图像的过程。本报告中以人脸画像-照片合成和图像超分辨率重建为例介绍图像跨域重建的概、理论与方法。首先介绍跨域图像重建产生的背景、意义和社会需求,进而介绍图像跨域重建的研究现状以及我们团队在此方向上的最新研究进展。最后介绍跨域图像重建在其他领域的推广应用。
特邀报告二(9月17日,10:00-11:00)
报告人:殷大伟
Dawei Yin is Senior Director of Engineering at Baidu inc.. He is managing the search science team at Baidu, leading Baidu's science efforts of web search, question answering, video search, image search, news search, visual search etc. Previously, he was Senior Director, managing the recommendation engineering team at JD.com between 2016 and 2019. Prior to JD.com, he was Senior Research Manager at Yahoo Labs, leading relevance science team and in charge of Core Search Relevance of Yahoo Search. He obtained Ph.D. (2013), M.S. (2010) from Lehigh University and B.S: (2006) from Shandong University. His research interests include data mining, applied machine learning, information retrieval and recommender system. He published over 100 research papers in premium conferences and journals, and was the recipients of WSDM2016 Best Paper Award, KDD2016 Best Paper Award, WSDM2018 Best Student Paper Award.
报告题目:Pretrained Language Models in Web Search
报告摘要:Pre-trained Language Models (PLMs), such as BERT and ERNIE, lead to remarkable headway in many Natural Language Processing tasks. In the information retrieval (IR) community, PLMs have also attracted much attention, and various PLMs and training strategies have been developed for different IR applications. Despite the initial success achieved by existing studies, there are still many challenges to be addressed, especially when applying and deploying PLMs in real-world scenarios. In this speech, I will introduce a series of efforts on Pretrained Language Models in web search engine which significantly improves the overall usability of web search.
特邀报告三 (9月18日,8:30-9:30)
报告人:ChengXiang Zhai
ChengXiang Zhai (http://czhai.cs.illinois.edu/) is a Donald Biggar Willett Professor in Engineering of the Computer Science Department at the University of Illinois at Urbana-Champaign (UIUC), where he is also affiliated with School of Information Sciences, Department of Statistics, and the Carl R. Woese Institute for Genomic Biology. He received a Ph.D. in Computer Science from Nanjing University in 1990, and a Ph.D. in Language and Information Technologies from Carnegie Mellon University in 2002. He worked at Clairvoyance Corp. as a Research Scientist and a Senior Research Scientist from 1997 to 2000 before joining UIUC in 2002. His research interests are in intelligent information retrieval, data mining, natural language processing, machine learning, and their applications. He has published over 300 papers in these areas and holds 6 patents, contributing many general effective models and algorithms for information retrieval and text mining. He offers two MOOCs on Coursera and has published a textbook on Text Data Management and Analysis. He served as Associate Editors for major journals in multiple areas (ACM TOIS, ACM TKDD, ACM TIST, IPM,and BMC MIDM), Program Co-Chairs of CIKM'04, NAACL HLT'07, SIGIR'09, and WWW'15, and Conference Co-Chairs of CIKM'16, WSDM'18, and IEEE BigData'20. He is an ACM Fellow and a member of ACM SIGIR Academy. He received numerous awards, including ACM SIGIR Gerard Salton Award, ACM SIGIR Test of Time Paper Award (three times), the US Presidential Early Career Award for Scientists and Engineers (PECASE), Alfred P. Sloan Research Fellowship, IBM Faculty Award, HP Innovation Research Award, Google Research Award, Microsoft Beyond Search Research Award, UIUC Rose Award for Teaching Excellence, and UIUC Campus Award for Excellence in Graduate Student Mentoring. He has graduated 38 PhD students and over 50 master students.
报告题目:I3A: An Intelligent Interactive Information Agent Model for Information Retrieval
报告摘要:Information Retrieval (IR) can be broadly interpreted as an interactive process for connecting users with the right information at the right time to finish a task, where interaction can be multimodal (e.g., using text, speech, and gestures) and connection can be made in multiple ways (e.g., querying, browsing, and recommendation). Although many formal IR models have been developed, the existing models are generally restricted to modeling the problem of ranking information items in response to a user's query without much consideration of user interaction. As a result, how to develop a general formal model that can cover all the variations of interactive IR (IIR) remains an open challenge. In this talk, I will discuss how we can address this challenge and present a general formal model for IR, called Intelligent Interactive Information Agent (I3A) model, which provides a unified theoretical foundation for both optimizing and evaluating sophisticated IIR algorithms and application systems. In I3A, an IIR system is modeled generally as an intelligent interactive information agent which plays an interactive cooperative ``game" with its user(s), where both parties would take turns to ``make moves" and interact with each other with a common objective of helping a user finish a task with minimum overall user effort. The optimization of IIR can be formally modelled as the agent optimizing a sequence of interaction decisions in response to each user action in a Bayesian decision framework. I will discuss how to refine the various components of the decision framework to make I3A operational and how multiple existing models, such as the Interface Card Model, the Probability Ranking Principle for IIR, formal models of users, and online learning to rank, can all be covered in the general I3A model. The I3A model also naturally suggests a new general methodology of evaluating IIR systems using search simulation.
特邀报告四(9月18日,9:30-10:30)
报告人:曹朝
曹朝,博士,华为泊松实验室主任、公司搜索技术工作组组长、公司区块链技术工作组组长。加入华为前于北京理工大学任副教授,先后在惠普研究院、IBM研究院担任资深研究员。2004年和2010年于北京理工大学获得学士和博士学位。研究兴趣包括搜索、推荐、分布式系统、区块链、大数据等方向。中国中文信息学会信息检索专委会委员,CCF区块链专业委员会常务委员、数据库专业委员会委员。
报告题目:知识驱动的搜索推荐技术
报告摘要:随着机器学习技术的发展,搜索推荐在智能程度上有了长足进步,在搜索引擎、信息流、电商、社交等互联网超级应用方面取得了举世瞩目的商业成就,用户对智能化体验方面仍有非常强的期许,企业面临开发成本高、人才短缺等挑战,缺乏世界知识以及对应的推理能力是关键问题之一。本报告的内容主要包括:(1)回顾知识驱动搜索推荐技术的发展历程,尤其是知识增强的搜索推荐能力和专家知识辅助搜索推荐算法设计;(2)介绍我们提出的世界知识模型World Knowledge Model(WKM)如何互联网内容学习/提炼显示知识和隐式知识,使得搜索和推荐引擎具备推理能力;(3)针对ToB垂域搜索中面临的开发成本高、定制化多等问题,探讨通过知识驱动实现更高效的垂域搜索引擎设计和开发。
专题讲习班
专题讲习班一(9月16日,13:30-15:30)
报告人:李晨亮
武汉大学国家网络安全学院教授、博士生导师。研究兴趣包括信息检索、自然语言处理、机器学习和社交媒体分析。在相关领域国际会议和期刊如SIGIR、ACL、AAAI、IJCAI、WWW、TKDE、TOIS等发表论文70余篇,担任多个信息检索国际权威学术期刊ACM TOIS、ACM TALLIP、JASIST和IPM的编委;担任中国中文信息学会青年工作委员会副主任、社交媒体专委会委员、信息检索专委会委员、情感计算专委会执行委员。曾获SIGIR2016最佳学生论文候选、曾入选湖北省青年拔尖人才计划与武汉市黄鹤英才计划。
报告人:王鹏飞
2017 年毕业于中国科学院计算技术研究所,加入北京邮电大学计算机学院,任副教授,硕士生导师。研究领域专注于研究用户行为的时序建模、数据挖掘、机器学习等任务。主要科研成果发表在国际顶级学术期刊和会议累计 60余篇,一作/通讯身份发表 CCF-A/B 类论文 20 余篇,高引论文一篇。应邀担任多个国际重要学术会议期刊的审稿人。中国中文信息学会信息检索专委会委员,中国中文信息学会青年工作委员会 CIPS 委员,中国信息检索大会 2022 年出版主席,第十届全国社会媒体处理大会 SMP2022 线上主席。2022 年AMINER 评选全球人工智能人才。
报告题目:Data Denoising Metrics in Recommendation System
报告摘要: 推荐系统已经成为缓解信息过载问题的重要途经。为了进一步提升推荐决策的准确性,引入更多相关的上下文信息,以此缓解该场景中用户-商品交互数据的稀疏性便成为工业学术界一个主流的方法。尽管该策略在多个场景中取得了不错的效果,但是低质、无关信息的引入亦不可避免地影响推荐系统的性能。如何自动的去除这些杂乱的信息,提升引入数据的质量,高效的完成推荐的任务,便是一个十分重要的研究问题。针对该问题, 本次报告我们整理并汇报了推荐场景中数据去噪的一系列工作。我们将系统的从细粒度的特征、商品维度,和粗粒度的关联模式、模态维度去分析数据去噪策略在推荐场景的应用。
专题讲习班二(9月16日,15:30-17:30)
报告人:冯骁骋
哈尔滨工业大学计算学部社会计算与信息检索研究中心副教授、博导,中文信息处理黑龙江省重点实验室主任助理,哈工大计算学部仲荣论坛副主席。研究兴趣包括自然语言处理、文本生成、机器翻译等。在ACL、AAAI、IJCAI、TKDE、Chinese Science等CCF A/B类国际会议及期刊发表论文30余篇。据Google学术统计,论文引用数量超过2000次,两篇论文入选Google学术2020年高被引榜单,一篇论文入选Paper Digest EMNLP 2020 Top Ten 高引论文。担任NIPS、ICML、AAAI、IJCAI、ACL等国际会议程序委员会高级/普通成员;兼任鹏城国家实验室双聘副研究员、中国中文信息学会自然语言生成与智能写作专委会副秘书长、中国计算机协会哈尔滨YOCSEF副主席等。入选中国科协第六届青年人才托举工程,曾获一级学会中国中文信息学会优秀博士学位论文奖、黑龙江省科技进步二等奖一项。主持科技创新2030—新一代人工智能重大项目子课题一项、国家实验室重点项目课题一项(2300万)、国家自然科学青年基金一项、黑龙江省优秀青年基金一项,MSRA Collaborative Research Program;与华为、腾讯、科大讯飞等国际一流互联网公司保持长期科研合作关系。
报告题目:大模型背景下的自然语言生成技术研究
报告摘要:近年来随着深度学习技术的快速发展,特别是预训练语言模型的出现使得自然语言生成领域发生了巨大变革。随着模型参数的不断增多文本流畅性和连贯性获得了显著提升,促进了生成技术的应用落地。然而,自然语言生成技术除了需要表达流畅之外更重要的是研究写什么和怎么写的问题,以及如何使得生成模型具有可解释性和可控能力。本次报告主要围绕这一系列问题进行展开,在简要介绍生成任务和预训练模型的同时,重点讨论如何帮助大模型对任务特征进行有效学习,提升可解释性,以及如何有效对模型生成文本进行长度和风格的控制。最后,对当前自然语言生成领域挑战进行简要总结并对未来发展趋势进行展望。
青年论坛(9月17日,10:30-12:00)
青年论坛一
报告人:雷文强
博士,四川大学研究员,博士生导师,国家级青年人才。博士毕业于新加坡国立大学。从事基于自然语言处理和信息检索的人在环路、人机交互系统研究,比如对话系统、问答系统、对话式推荐/信息检索系统。其担任通讯作者的论文获得国际多媒体最高级会议ACM 2020最佳论文奖(1700篇中选一篇)。以第一作者或者通讯作者发表中国计算机学会A类长文(CCF-A)十余篇,其中设计的Sequicity对话系统模型发表在ACL上,三年内被引200余次,被IEEE Fellow 高剑锋博士的权威综述《Neural Approach to Conversational AI》评价为“极大简化了传统系统的设计和优化”。与荷兰皇家科学院院士Maarten de Rijke教授联袂在国际顶级会议SIGIR2020和Recsys2021上作关于“对话式推荐系统”三小时tutorial,尤其是在SIGIR2020的tutorial,单场听众超过1600次,为全场听众最多。担任各大顶级国际会议比如ACL,KDD,AAAI,IJCAI,WSDM,EMNLP等的(高级)程序委员会委员,担任新加坡全国自然语言处理会议SSNLP2021的程序委员会主席和IEEE 旗下国际会议DSS 2022 的Workshop 主席。担任重要期刊ACM Trans. on Web的客座编委,担任国内外顶级期刊比如IEEE Trans. on IEEE Trans. on Knowledge and Data Engineering, ACM Trans. on Information System,《中国科学:信息科学》等的审稿人。积极推进前沿科学研究的实际落地,其研发的技术在大型互联网企业,政府机构等有广泛应用。
报告题目:主动对话策略新范式:学会与不合作用户沟通
报告摘要: 对话系统如何在多轮对话中与用户主动互动是当今对话系统发展的关键问题之一。现有的关于对话系统的研究集中在基于语料库的设置上,这并不能反映多轮对话的动态本质。因此,我们提出了在交互环境中学习主动对话策略的新范式,并首次研究了真实交互中普遍存在的不合作的用户行为。具体来说,我们探讨一种主动对话策略I-Pro,其目的是在机器代理的第一个目标 "快速达到目标话题 "和第二个目标 "保持高用户满意度 "之间取得平衡。为了验证这个设想,我们设计了多种实验以论证I-Pro在与不合作的用户进行主动多轮对话中的卓越有效性和可解释性。期待本次分享抛砖引玉,共同探讨主动对话这一课题的更多可能性。
青年论坛二
报告人:李晨亮
武汉大学国家网络安全学院教授、博士生导师。研究兴趣包括信息检索、自然语言处理、机器学习和社交媒体分析。在相关领域国际会议和期刊如SIGIR、ACL、AAAI、IJCAI、WWW、TKDE、TOIS等发表论文70余篇,担任多个信息检索国际权威学术期刊ACM TOIS、ACM TALLIP、JASIST和IPM的编委;担任中国中文信息学会青年工作委员会副主任、社交媒体专委会委员、信息检索专委会委员、情感计算专委会执行委员。曾获SIGIR2016最佳学生论文候选、曾入选湖北省青年拔尖人才计划与武汉市黄鹤英才计划。
报告题目:推荐系统的前沿进展与挑战
报告摘要:推荐系统的广泛应用对于数字经济的发展起到重要推动作用。近年来相关研究越来越细化,比如推荐任务可分为评分预测、协同过滤、序列推荐和会话推荐等;推荐系统可划分为召回与精排两阶段。本次报告将对推荐系统的主要细分领域近期的进展做一个简单的回顾,并横向比较同系列任务/场景的区别和挑战,最后讨论未来的挑战。
青年论坛三
报告人:赵鑫
中国人民大学高瓴人工智能学院教授。2014年7月于北京大学获得博士学位,随后进入中国人民大学工作至今。研究领域为信息检索与自然语言处理,共计发表论文100余篇。曾荣获2021年 CCF-IEEE CS青年科学家奖、2020年吴文俊人工智能优秀青年奖、ECIR 2021时间检验奖(Test of Time Award)等,入选中国科协青年人才托举工程、北京智源青年科学家。
报告题目:可迁移的推荐系统
报告摘要:推荐系统已经成为解决信息过载必不可少的基础性技术,受到了学术界和工业界的广泛关注。最近几年随着深度学习的兴起,见证了推荐算法的快速发展。已有推荐算法绝大部分都是针对特定应用领域专门定制,训练完成后推荐模型迁移到其他应用领域的难度较高。本次报告将围绕可迁移的推荐系统展开,探讨如何设计领域无关、模型可迁移的推荐算法,重点将介绍基于文本预训练模型的跨域推荐算法,通过学习可迁移的文本语义实现推荐模型的复用。最后,还将简要介绍深度学习推荐算法库“伯乐”的相关进展。
工业论坛 (9月17日,11:00-12:00)
报告一:中文文本自动校对技术的研究现状与应用探索
报告人:王宝鑫
科大讯飞研究主管、资深研究员,毕业于哈尔滨工业大学计算机学院,获工学学士和硕士学位,并继续攻读博士学位。从事文本自动校对、智能司法等NLP领域相关研究,主要研究涉及中文拼写纠错、文本分类、智能问答等方向。组织筹办多次法律阅读理解比赛、中文文本纠错比赛,推动相关领域中文技术的发展。曾获得国际评测“中文语法错误检测比赛”CGED冠军、知识图谱挑战赛OGB冠军、天智杯文本勘误比赛冠军等。主导研发了飞鹰智能校对系统、“法小飞”法律咨询助手等产品,并在ACL、EMNLP等国际会议上发表多篇论文。
报告二:快手用户LTV预估模型介绍
报告人:杨乃君
快手电商推荐和用户增长模型算法负责人,期间参与并设计了业内首家强化学习在短视频推荐落地应用,领导团队在直播、短视频电商场景落地超长序列建模、Session建模、兴趣探索等技术;在用户增长业务落地10亿级用户LTV模型和因果推断模型应用。经历了快手电商推荐系统从零到一搭建和DAU从1亿到3亿的增长过程。
报告三:构建公安行业知识图谱,助力公安智能决策
报告人:彭海军
重庆首亨软件股份有限公司董事长兼总经理,曾任北京东方国信数据分析师、系统架构师,拥有15年以上的政府、公安、医疗、运营商、企业等领域商业智能和大数据平台软件研发、设计、规划、实施等经验。研究领域:大数据+行业应用,海量数据库存储及分析、软件项目管理、敏捷开发及低代码编程AI技术、工业元宇宙。
报告四:RocketQA - 面向稠密文本检索的训练方法、工具和数据集
报告人:刘璟
百度自然语言处理部主任研发架构师。长期从事自然语言处理方向的研究和应用工作。哈尔滨工业大学博士毕业,曾任微软亚洲研究院研究员。现于百度负责问答、信息检索和可信相关的技术研发,支持公司的搜索、广告、智能云等核心业务。发表ACL、SIGIR等会议论文20余篇,Google Scholar引用1600余次,多次在MRQA、MSMARCO、NTCIR等评测中获得第一,曾任ACL问答方向领域主席。
报告五:合规背景下互联网大数据的新应用和新场景
报告人:梁斌
梁斌博士,北京八友科技创始人,于2015年在清华大学计算机科学与技术系获得博士学位。曾在搜狗搜索从事搜索算法研究,发表多项相关书籍和专利,包括编著《走进搜索引擎》,译著《Managing gigabytes(深入搜索引擎)》,推动行业发展。2015年博士毕业后,梁斌创办北京八友科技,从事公开数据的采集和分析相关工作,与业界一线互联网公司和相关机构建立了广泛的合作。