澳门六合彩官网 用大模子吃瓜更智能了!阿里通义实验室冷漠新时候线归来框架,全面进步新闻归来效劳
当今,大模子不错帮你梳理新闻时候线了澳门六合彩官网,以后吃瓜就更浮浅了!
AI Agent的风,我们赛博乐子东说念主也得吹吹。
这即是来自阿里巴巴通义实验室与上海交通大学的新辩论,他们冷漠了一种基于Agent的新闻时候线纲领新框架——CHRONOS。
它不仅不错帮你从海量新闻中归来出遑急事件,更遑急的是,它还不错梳理出了了的时候线,以后上网冲浪时千般复杂事件都一目了然。
其中的CHRONOS一词取自希腊听说中的时候之神柯罗诺斯。
该框架通过迭代多轮的自我发问面孔,伙同检索增强生成时候,从互联网上检索有关事件信息,并生成时候法规的新闻纲领,为新闻时候线纲领生成提供了一种全新的惩办决议。
先来一说念瞅瞅几个例子。
比如对于新闻“国足1-0巴林”,CHRONOS大要归来海量新闻,呈现事件的一脉疏通。
对于掩盖时候更长的新闻“中国探月工程”,CHRONOS也能聚焦要点事件,呈刻下候线发展,使得用户大要一目了然。
补都敞开域TLS短板
时候线归来(Timeline Summarization, TLS)任务是一种当然讲话处理界限的经典时候挑战,它旨在从多数文本数据中索要要道事件,并定时代法规摆设,以提供对某一主题或界限历史发展的结构化视图。
举例,在新闻界限,时候线归来不错匡助用户快速了解一个新闻事件的一脉疏通。该任务不仅条件识别出遑急的事件,还需轨范略事件之间的时候干系和因果磋议,以便生成一个连贯、精真金不怕火且信息丰富的时候线纲领。
说明可检索事件的开端,不错将TLS任务细分为阻塞域(closed-domain)和敞开域(open-domain)两个设定:在阻塞域TLS任务中,时候线是从一组预界说的、与特定主题或界限有关的新闻著述中创建的,而敞开域TLS指的是从互联网上径直搜索和检索新闻著述来生成时候线的经过。
往时的责任东要围聚于惩办阻塞域上时候线生成问题,而敞开域TLS则需要开阔的信息检索和筛选才智,以及在莫得全局视图的情况下识别和竖立事件之间磋议的才智,为这项任务冷漠了新的要乞降挑战。
迭代检索的CHRONOS框架
为了应付上述挑战,团队冷漠CHRONOS框架,通过迭代发问进行有关事件检索,生成准确、全面的时候线纲领,大要灵验地惩办敞开域和阻塞域两种设定下的TLS任务。
1. 动机
时候线生成的中枢在于竖立事件之间的时候和因果干系。
每个新闻事件都不错被默示为一个不同的节点,任务的地点是竖立这些节点之间的边,以展示它们的有关性,并最终造成一个异构图,从主题新闻的节点最先。
因此,通过一个检索机制来检索有关的新闻著述,不错灵验竖立这些边,造成事件之间的磋议。
2. 概括
CHRONOS期骗大模子的才智,通过模拟东说念主类信息检索的经过,即通过冷漠问题、基于检索戒指进一步冷漠新的问题,最终汇注对于有关事件的全面信息并归来为时候线。
CHRONOS包括以下几个模块:
自我发问 (Self-Questioning):最初搜索粗粒度的新闻配景信息,然后迭代地冷漠问题澳门六合彩官网,以检索更多有关新闻。
问题改写 (Question Rewriting):将复杂或施展欠安的问题解析为更具体、更易检索的查询。
时候线生成 (Timeline Generation):通过吞并每一轮检索生成的时候线来归来一个卓越遑急事件的时候线。
3. 自我发问3.1 粗粒度配景调研
在自我发问的运转阶段,CHRONOS使用地点新闻的标题看成要道词进行搜索,以汇注与地点新闻最径直有关的信息。
这些信息组成了新闻配景(News Context),为自我发问打下初步基础。
3.2 发问示例选拔
在粗粒度配景调研之后,CHRONOS期骗大模子的高下文体习才智,通过少许样本领导来领导模子生成对于地点新闻的问题。
为了评估问题样本色量,引入了时序信息量(Chrono-Informativeness, CI)的认识,用来推测模子冷漠的问题检索与参考时候线对都事件的才智,即高CI值的问题更有可能辅导检索到与地点新闻事件有关的著述,用检索生成的时候线和参考时候线中包含日历的F1分数进行推测。
基于最大化问题集时序信息量的地点,构建一个“新闻-问题”的示例池,用于领导新地点新闻的问题生成。
对于每个新的地点新闻,通过余弦相似性动态检索与地点新闻最相似的样本,确保了样本的高下文有关性和时候信息的准确性。
3.3 迭代发问
CHRONOS通过连气儿迭代发问,迟缓深入探索事件的细节。
每一轮迭代都基于前一轮的检索戒指,以发现新的问题和信息,直到满足时候线中事件数目或达到最大迭代次数。
3.4 问题改写
特奥:“我们打了一场非常精彩的比赛。我们知道国际米兰是一支伟大的球队。我经历了一个困难的时刻,还没有达到100%,但我能做的是像今天一样帮助球队。”
查询改写(Query Rewriting)是检索增强生成中常用的优化程序。
在CHRONOS框架中,团队通过对运转发问阶段产生的平淡或复杂问题改写为2-3个更易于检索的子问题,大要生成更具体、更有针对性的查询,从而提高搜索引擎的检索成果。
他们不异在领导中加入少许样本,领导大模子进行灵验改写,将复杂问题滚动为更具体的查询,同期保捏问题的原始意图。
3.5 时候线生成
CHRONOS通过两阶段生成完好的时候线归来:生成(Generation)和吞并(Merging)。
生成:通过分析每一轮检索到的新闻著述来识别要道事件和扫视信息。期骗大模子的领路和生成才智,索要每个事件的发寿辰期和有关细节,并为每个事件撰写精真金不怕火的描摹。这些事件和描摹被组织成初步的时候线,按照时候法规摆设,为后续的吞并阶段提供基础。
吞并:将多轮检索生成的初步时候线整合成一个连贯的最终纲领。这已经过波及对都不同时代线中的事件、惩办任何日历或描摹上的龙套,并选拔最具代表性和遑急性的事件。
全新数据集OPEN-TLS
为了评估TLS系统,辩论团队还汇注了由专科记者撰写的对于近期新闻事件的时候线,构建了一个名为Open-TLS的新数据集。
与以往阻塞域的数据集比较,Open-TLS不仅在数据集范围和内容上愈加千般化,掩盖政事、经济、社会、体育和科学时候等多个界限,而况在时效性上更具上风,为敞开域TLS任务提供了一个更全面和更具挑战性的基准。
实验戒指
1. 实验设定
实验基于GPT-3.5-Turbo、GPT-4和Qwen2.5-72B分裂构建CHRONOS系统,评测敞开域和阻塞域两个设定下TLS的性能施展。使用的评估盘算推算主要有:
ROUGE-N: 推测生成时候线和参考时候线之间的N-gram重复。具体包括:(1)Concat F1:通过将通盘日历纲领连气儿起来狡计ROUGE,以评估全体的一致性;(2)Agree F1:仅使用匹配日历的纲领狡计ROUGE,以评估特定日历的准确性;(3)Align F1:在狡计ROUGE之前,先说明相似性和日历接近性对预计纲领和参考纲领进行对都,评估对都后的一致性。
Date F1:推测生成时候线中日历与参考时候线中真确日历匹配进度。
2. 敞开域TLS
在敞开域TLS的实验中,CHRONOS与几个基线程序进行了比较,包括径直搜索地点新闻(DIRECT)和重写地点新闻以创建查询用于检索(REWRITE)。
对比之下,CHRONOS通过迭代自我发问和检索有关新闻著述的程序,显耀提高了事件归来的质料和日历对都的准确性,在所霸术上都跳动于基线程序。
3. 阻塞域TLS
在阻塞域TLS的实验中,CHRONOS与之前的代表性责任进行了比较,包括:(1)基于事件团聚程序的CLUST (Gholipour Ghalandari and. Ifrim, 2020);(2)基于事件图模子EGC(Li et al., 2021)和(3)期骗大模子进行事件聚类的LLM-TLS(Hu et al., 2024)。
在Crisis和T17这两个经典数据集上的比较戒指深切,CHRONOS达到了与这些责任雷同的施展,在两个数据集的AR-2盘算推算上得回了SOTA成果,诠释了其在不同类型事件和时候跨度上的开阔性能和适宜性。
4. 运行时候分析
CHRONOS的另一个上风体当今效劳方面。
与不异基于大模子、但需要处理新闻库中通盘著述的LLM-TLS程序比较,它通过检索增强机制专注于最有关的新闻著述,显耀减少了处理时候。
这种效劳的进步使其在践诺应用中更为实用,尤其是在需要快速反应的场景中。
案例辩论:苹果产物发布时候线
团队深入分析了模子在处理具体新闻事件时的施展,通过选拔具有代表性的新闻事件,如苹果公司的紧要产物发布,大要不雅察到CHRONOS若何通过按部就班的自我发问和信息检索来生成时候线。
在案例辩论中,CHRONOS展示了其大要准确索要要道事件和日历的才智,同期也揭示了在某些情况下可能需要更始的地方,举例对某些事件的遗漏或日历幻觉。
结语
CHRONOS框架通过伙同大型讲话模子的迭代自我发问和检索增强生成时候,为时候线归来任务提供了一种新颖且灵验的惩办决议。
这种程序的中枢在于模拟东说念主类的信息检索经过,通过束缚地冷漠和回复新问题来迟缓深入领路事件,最终身成一个全面且连贯的时候线纲领。
实验戒指已经充分诠释了CHRONOS在复杂事件检索和构建时候线方面的才智,展示了该框架在践诺新闻时候线生成应用中的应用后劲和准确性。
同期,这种迭代发问的检索生成程序是否具有泛化到通用任务上的才智也值得畴昔进一步辩论。
Reference:
[1] Demian Gholipour Ghalandari and Georgiana Ifrim. 2020. Examining the state-of-the-art in news timeline summarization. In Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics, pages 1322–1334, Online. Association for Computational Linguistics.
[2] Manling Li, Tengfei Ma, Mo Yu, Lingfei Wu, Tian Gao, Heng Ji, and Kathleen McKeown. 2021. Timeline summarization based on event graph compression via time-aware optimal transport. In Proceedings of the 2021 Conference on Empirical Methods in Natural Language Processing, pages 6443–6456, Online and Punta Cana, Dominican Republic. Association for Computational Linguistics.
[3] Qisheng Hu, Geonsik Moon, and Hwee Tou Ng. 2024. From moments to milestones: Incremental timeline summarization leveraging large language models. In Proceedings of the 62nd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), pages 7232–7246, Bangkok, Thailand. Association for Computational Linguistics.
— 完 —澳门六合彩官网