澳门六合彩

澳门六合彩资料图 用大模子吃瓜更智能了!阿里通义实验室建议新时刻线回首框架,全面擢升新闻回首遵循

发布日期:2024-12-27 17:40    点击次数:79

灵通域和顽固域TLS都更高效了

当今澳门六合彩资料图,大模子不错帮你梳理新闻时刻线了,以后吃瓜就更粗浅了!

AI Agent的风,我们赛博乐子东说念主也得吹吹。

这便是来自阿里巴巴通义实验室与上海交通大学的新探讨,他们建议了一种基于Agent的新闻时刻线摘抄新框架——CHRONOS。

它不仅不错帮你从海量新闻中回首出要紧事件,更要紧的是,它还不错梳理出明晰的时刻线,以后上网冲浪时各式复杂事件都一目了然。

其中的CHRONOS一词取自希腊外传中的时刻之神柯罗诺斯。

该框架通过迭代多轮的自我发问神色,连系检索增强生成时期,从互联网上检索有关事件信息,并生成时刻划定的新闻摘抄,为新闻时刻线摘抄生成提供了一种全新的措置有策画。

先来全部瞅瞅几个例子。

比如对于新闻“国足1-0巴林”,CHRONOS或者回首海量新闻,呈现事件的来因去果。

对于障翳时刻更长的新闻“中国探月工程”,CHRONOS也能聚焦重苦衷件,呈当前刻线发展,使得用户或者一目了然。

补皆灵通域TLS短板

浙江省淳安县纪委监委开展流动接访,收集问题线索。谢航凯摄

针对党员干部的诬告陷害行为,不仅会空耗纪检监察机关监督执纪的工作精力,挫伤党员干部的干事热情,也会危害政治生态、破坏干事创业的发展环境。推动全面从严治党向纵深发展,开展澄清正名工作,才能还清白者清白、为担当者担当,让领导干部敢于担当作为。近年来,重庆常态化开展澄清正名工作,市级层面、各区县等相继出台文件、明确细则,创新工作举措,通过专项行动,持续推动澄清正名规范化制度化,为干事者撑腰、为创业者鼓劲。

时刻线回首(Timeline Summarization, TLS)任务是一种当然谈话处理鸿沟的经典时期挑战,它旨在从多数文本数据中索求弱点事件,并依时间划定成列,以提供对某一主题或鸿沟历史发展的结构化视图。

举例,在新闻鸿沟,时刻线回首不错匡助用户快速了解一个新闻事件的来因去果。该任务不仅条目识别出要紧的事件,还需门径路事件之间的时刻关连和因果斟酌,以便生成一个连贯、爽气且信息丰富的时刻线摘抄。

凭据可检索事件的开头,不错将TLS任务细分为顽固域(closed-domain)和灵通域(open-domain)两个设定:在顽固域TLS任务中,时刻线是从一组预界说的、与特定主题或鸿沟有关的新闻著作中创建的,而灵通域TLS指的是从互联网上径直搜索和检索新闻著作来生成时刻线的流程。

往日的使命东要蚁集于措置顽固域上时刻线生成问题,而灵通域TLS则需要高大的信息检索和筛选智力,以及在莫得全局视图的情况下识别和建筑事件之障碍洽的智力,为这项任务建议了新的要乞降挑战。

迭代检索的CHRONOS框架

为了应付上述挑战,团队建议CHRONOS框架,通过迭代发问进行有关事件检索,生成准确、全面的时刻线摘抄,或者灵验地措置灵通域和顽固域两种设定下的TLS任务。

1. 动机

时刻线生成的中枢在于建筑事件之间的时刻和因果关连。

每个新闻事件都不错被暗意为一个不同的节点,任务的标的是建筑这些节点之间的边,以展示它们的有关性,并最终酿成一个异构图,从主题新闻的节点入手。

因此,通过一个检索机制来检索有关的新闻著作,不错灵验建筑这些边,酿成事件之间的斟酌。

2. 轮廓

CHRONOS诈欺大模子的智力,通过模拟东说念主类信息检索的流程,即通过建议问题、基于检索已毕进一步建议新的问题,最终汇集对于有关事件的全面信息并回首为时刻线。

CHRONOS包括以下几个模块:

自我发问 (Self-Questioning):当先搜索粗粒度的新闻配景信息,然后迭代地建议问题,以检索更多有关新闻。

问题改写 (Question Rewriting):将复杂或进展欠安的问题证实为更具体、更易检索的查询。

时刻线生成 (Timeline Generation):通过归拢每一轮检索生成的时刻线来去顾一个卓著要紧事件的时刻线。

3. 自我发问3.1 粗粒度配景调研

在自我发问的开动阶段,CHRONOS使用标的新闻的标题看成弱点词进行搜索,以汇集与标的新闻最径直有关的信息。

这些信息组成了新闻配景(News Context),为自我发问打下初步基础。

3.2 发问示例选拔

在粗粒度配景调研之后,CHRONOS诈欺大模子的险阻体裁习智力,通过少许样本提醒来率领模子生成对于标的新闻的问题。

为了评估问题样骨子量,引入了时序信息量(Chrono-Informativeness, CI)的认识,用来臆测模子建议的问题检索与参考时刻线对皆事件的智力,即高CI值的问题更有可能沟通检索到与标的新闻事件有关的著作,用检索生成的时刻线和参考时刻线中包含日历的F1分数进行臆测。

基于最大化问题集时序信息量的标的,构建一个“新闻-问题”的示例池,用于率领新标的新闻的问题生成。

对于每个新的标的新闻,通过余弦相似性动态检索与标的新闻最相似的样本,确保了样本的险阻文有关性和时刻信息的准确性。

3.3 迭代发问

CHRONOS通过一语气迭代发问,邋遢深入探索事件的细节。

每一轮迭代都基于前一轮的检索已毕,以发现新的问题和信息,直到倨傲时刻线中事件数目或达到最大迭代次数。

3.4 问题改写

查询改写(Query Rewriting)是检索增强生成中常用的优化门径。

在CHRONOS框架中,团队通过对开动发问阶段产生的平素或复杂问题改写为2-3个更易于检索的子问题,或者生成更具体、更有针对性的查询,从而提高搜索引擎的检索遵循。

他们相似在提醒中加入少许样本,率领大模子进行灵验改写,将复杂问题转化为更具体的查询,同期保抓问题的原始意图。

3.5 时刻线生成

CHRONOS通过两阶段生成完满的时刻线回首:生成(Generation)和归拢(Merging)。

生成:通过分析每一轮检索到的新闻著作来识别弱点事件和安逸信息。诈欺大模子的默契和生成智力,索求每个事件的发生辰期和有关细节,并为每个事件撰写爽气的态状。这些事件和态状被组织成初步的时刻线,按照时刻划定成列,为后续的归拢阶段提供基础。

归拢:将多轮检索生成的初步时刻线整合成一个连贯的最终摘抄。这一流程触及对皆不同时间线中的事件、措置任何日历或态状上的冲破,并选拔最具代表性和要紧性的事件。

全新数据集OPEN-TLS

为了评估TLS系统,探讨团队还汇集了由专科记者撰写的对于近期新闻事件的时刻线,构建了一个名为Open-TLS的新数据集。

与以往顽固域的数据集比较,Open-TLS不仅在数据集限度和内容上愈加各种化,障翳政事、经济、社会、体育和科学时期等多个鸿沟,何况在时效性上更具上风,为灵通域TLS任务提供了一个更全面和更具挑战性的基准。

实验已毕

1. 实验设定

实验基于GPT-3.5-Turbo、GPT-4和Qwen2.5-72B辩认构建CHRONOS系统,评测灵通域和顽固域两个设定下TLS的性能进展。使用的评估主义主要有:

ROUGE-N: 臆测生成时刻线和参考时刻线之间的N-gram重复。具体包括:(1)Concat F1:通过将通盘日历摘抄一语气起来计较ROUGE,以评估合座的一致性;(2)Agree F1:仅使用匹配日历的摘抄计较ROUGE,以评估特定日历的准确性;(3)Align F1:在计较ROUGE之前,先凭据相似性和日历接近性对臆测摘抄和参考摘抄进行对皆,评估对皆后的一致性。

Date F1:臆测生成时刻线中日历与参考时刻线中信得过日历匹配进程。

2. 灵通域TLS

在灵通域TLS的实验中,CHRONOS与几个基线门径进行了比较,包括径直搜索标的新闻(DIRECT)和重写标的新闻以创建查询用于检索(REWRITE)。

对比之下,CHRONOS通过迭代自我发问和检索有关新闻著作的门径,显赫提高了事件回首的质地和日历对皆的准确性,在通盘主义上都进步于基线门径。

3. 顽固域TLS

在顽固域TLS的实验中,CHRONOS与之前的代表性使命进行了比较,包括:(1)基于事件团员门径的CLUST (Gholipour Ghalandari and. Ifrim, 2020);(2)基于事件图模子EGC(Li et al., 2021)和(3)诈欺大模子进行事件聚类的LLM-TLS(Hu et al., 2024)。

在Crisis和T17这两个经典数据集上的比较已毕久了,CHRONOS达到了与这些使命访佛的进展,在两个数据集的AR-2主义上获取了SOTA遵循,发挥了其在不同类型事件和时刻跨度上的高大性能和稳妥性。

4. 运行时刻分析

CHRONOS的另一个上风体当今遵循方面。

与相似基于大模子、但需要处理新闻库中通盘著作的LLM-TLS门径比较,它通过检索增强机制专注于最有关的新闻著作,显赫减少了处理时刻。

这种遵循的擢升使其在实践应用中更为实用,尤其是在需要快速反应的场景中。

案例探讨:苹果居品发布时刻线

团队深入分析了模子在处理具体新闻事件时的进展,通过选拔具有代表性的新闻事件,如苹果公司的要紧居品发布,或者不雅察到CHRONOS怎样通过轮回渐进的自我发问和信息检索来生成时刻线。

在案例探讨中,CHRONOS展示了其或者准确索求弱点事件和日历的智力,同期也揭示了在某些情况下可能需要立异的场合,举例对某些事件的遗漏或日历幻觉。

结语

CHRONOS框架通过连系大型谈话模子的迭代自我发问和检索增强生成时期,为时刻线回首任务提供了一种新颖且灵验的措置有策画。

这种门径的中枢在于模拟东说念主类的信息检索流程,通过不休地建议和恢复新问题来邋遢深入默契事件,最毕生成一个全面且连贯的时刻线摘抄。

实验已毕也曾充分发挥了CHRONOS在复杂事件检索和构建时刻线方面的智力,展示了该框架在实践新闻时刻线生成应用中的应用后劲和准确性。

同期,这种迭代发问的检索生成门径是否具有泛化到通用任务上的智力也值得明天进一步探讨。

Reference:

[1] Demian Gholipour Ghalandari and Georgiana Ifrim. 2020. Examining the state-of-the-art in news timeline summarization. In Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics, pages 1322–1334, Online. Association for Computational Linguistics.

[2] Manling Li, Tengfei Ma, Mo Yu, Lingfei Wu, Tian Gao, Heng Ji, and Kathleen McKeown. 2021. Timeline summarization based on event graph compression via time-aware optimal transport. In Proceedings of the 2021 Conference on Empirical Methods in Natural Language Processing, pages 6443–6456, Online and Punta Cana, Dominican Republic. Association for Computational Linguistics.

[3] Qisheng Hu, Geonsik Moon, and Hwee Tou Ng. 2024. From moments to milestones: Incremental timeline summarization leveraging large language models. In Proceedings of the 62nd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), pages 7232–7246, Bangkok, Thailand. Association for Computational Linguistics.

— 完 —澳门六合彩资料图







Powered by 澳门六合彩 @2013-2022 RSS地图 HTML地图

Powered by站群