新澳门六合彩开奖网站 用大模子吃瓜更智能了!阿里通义实验室提议新时候线回首框架,全面进步新闻回首效力 - 澳门六合彩
澳门六合彩
澳门六合彩

新澳门六合彩开奖网站 用大模子吃瓜更智能了!阿里通义实验室提议新时候线回首框架,全面进步新闻回首效力

2024-12-20 13:34:59

新澳门六合彩开奖网站 用大模子吃瓜更智能了!阿里通义实验室提议新时候线回首框架,全面进步新闻回首效力
绽开域和闭塞域TLS都更高效了

当今,大模子不错帮你梳理新闻时候线了新澳门六合彩开奖网站,以后吃瓜就更简短了!

AI Agent的风,我们赛博乐子东说念主也得吹吹。

这便是来自阿里巴巴通义实验室与上海交通大学的新商量,他们提议了一种基于Agent的新闻时候线摘记新框架——CHRONOS。

它不仅不错帮你从海量新闻中回首出要紧事件,更要紧的是,它还不错梳理出了了的时候线,以后上网冲浪时千般复杂事件都一目了然。

其中的CHRONOS一词取自希腊传闻中的时候之神柯罗诺斯。

该框架通过迭代多轮的自我发问状况,协调检索增强生成时期,从互联网上检索关联事件信息,并生成时候规章的新闻摘记,为新闻时候线摘记生成提供了一种全新的措置决策。

先来一齐瞅瞅几个例子。

比如对于新闻“国足1-0巴林”,CHRONOS随机回首海量新闻,呈现事件的一脉相承。

对于掩饰时候更长的新闻“中国探月工程”,CHRONOS也能聚焦要点事件,呈当前候线发展,使得用户随机一目了然。

补都绽开域TLS短板

时候线回首(Timeline Summarization, TLS)任务是一种当然话语处理规模的经典时期挑战,它旨在从多量文本数据中索要要津事件,并依时间规章成列,以提供对某一主题或规模历史发展的结构化视图。

举例,在新闻规模,时候线回首不错匡助用户快速了解一个新闻事件的一脉相承。该任务不仅条款识别出要紧的事件,还需轮番路事件之间的时候关系和因果筹商,以便生成一个连贯、简约且信息丰富的时候线摘记。

笔据可检索事件的开端,不错将TLS任务细分为闭塞域(closed-domain)和绽开域(open-domain)两个设定:在闭塞域TLS任务中,时候线是从一组预界说的、与特定主题或规模关联的新闻著述中创建的,而绽开域TLS指的是从互联网上胜利搜索和检索新闻著述来生成时候线的经过。

当年的责任东要荟萃于措置闭塞域上时候线生成问题,而绽开域TLS则需要强大的信息检索和筛选智商,以及在莫得全局视图的情况下识别和缔造事件之间筹商的智商,为这项任务提议了新的要乞降挑战。

迭代检索的CHRONOS框架

为了应付上述挑战,团队提议CHRONOS框架,通过迭代发问进行关联事件检索,生成准确、全面的时候线摘记,随机灵验地措置绽开域和闭塞域两种设定下的TLS任务。

1. 动机

时候线生成的中枢在于缔造事件之间的时候和因果关系。

每个新闻事件都不错被默示为一个不同的节点,任务的场地是缔造这些节点之间的边,以展示它们的关联性,并最终造成一个异构图,从主题新闻的节点出手。

因此,通过一个检索机制来检索关联的新闻著述,不错灵验缔造这些边,造成事件之间的筹商。

2. 轮廓

CHRONOS欺诈大模子的智商,通过模拟东说念主类信息检索的经过,即通过提议问题、基于检索死心进一步提议新的问题,最终汇聚对于关联事件的全面信息并回首为时候线。

CHRONOS包括以下几个模块:

自我发问 (Self-Questioning):领先搜索粗粒度的新闻配景信息,然后迭代地提议问题,以检索更多关联新闻。

问题改写 (Question Rewriting):将复杂或进展欠安的问题明白为更具体、更易检索的查询。

时候线生成 (Timeline Generation):通过归拢每一轮检索生成的时候线来回首一个卓越要紧事件的时候线。

3. 自我发问3.1 粗粒度配景调研

在自我发问的运转阶段,CHRONOS使用场地新闻的标题行动要津词进行搜索,以汇聚与场地新闻最胜利关联的信息。

这些信息组成了新闻配景(News Context),为自我发问打下初步基础。

3.2 发问示例接受

在粗粒度配景调研之后,CHRONOS欺诈大模子的高下文体习智商,通过少许样本领导来携带模子生成对于场地新闻的问题。

为了评估问题样推行量,引入了时序信息量(Chrono-Informativeness, CI)的观念,用来商酌模子提议的问题检索与参考时候线对都事件的智商,即高CI值的问题更有可能开垦检索到与场地新闻事件关联的著述,用检索生成的时候线和参考时候线中包含日历的F1分数进行商酌。

基于最大化问题集时序信息量的场地,构建一个“新闻-问题”的示例池,用于携带新场地新闻的问题生成。

对于每个新的场地新闻,通过余弦相似性动态检索与场地新闻最相似的样本,确保了样本的高下文关联性和时候信息的准确性。

3.3 迭代发问

CHRONOS通过一语气迭代发问,缓缓潜入探索事件的细节。

每一轮迭代都基于前一轮的检索死心,以发现新的问题和信息,直到餍足时候线中事件数目或达到最大迭代次数。

3.4 问题改写

查询改写(Query Rewriting)是检索增强生成中常用的优化范例。

在CHRONOS框架中,团队通过对运转发问阶段产生的平淡或复杂问题改写为2-3个更易于检索的子问题,随机生成更具体、更有针对性的查询,从而提高搜索引擎的检索效力。

他们雷同在领导中加入少许样本,携带大模子进行灵验改写,将复杂问题篡改为更具体的查询,同期保握问题的原始意图。

3.5 时候线生成

CHRONOS通过两阶段生成好意思满的时候线回首:生成(Generation)和归拢(Merging)。

生成:通过分析每一轮检索到的新闻著述来识别要津事件和详备信息。欺诈大模子的贯通和生成智商,索要每个事件的发诞辰期和关联细节,并为每个事件撰写简约的描写。这些事件和描写被组织成初步的时候线,按照时候规章成列,为后续的归拢阶段提供基础。

归拢:将多轮检索生成的初步时候线整合成一个连贯的最终摘记。这也曾过触及对都不同时间线中的事件、措置任何日历或描写上的打破,并接受最具代表性和要紧性的事件。

全新数据集OPEN-TLS

为了评估TLS系统,商量团队还汇聚了由专科记者撰写的对于近期新闻事件的时候线,构建了一个名为Open-TLS的新数据集。

与以往闭塞域的数据集比拟,Open-TLS不仅在数据集限制和内容上愈加千般化,掩饰政事、经济、社会、体育和科学时期等多个规模,况且在时效性上更具上风,为绽开域TLS任务提供了一个更全面和更具挑战性的基准。

实验死心

1. 实验设定

实验基于GPT-3.5-Turbo、GPT-4和Qwen2.5-72B别离构建CHRONOS系统,评测绽开域和闭塞域两个设定下TLS的性能进展。使用的评估盘算主要有:

ROUGE-N: 商酌生成时候线和参考时候线之间的N-gram近似。具体包括:(1)Concat F1:通过将所有日历摘记衔接起来意想ROUGE,以评估合座的一致性;(2)Agree F1:仅使用匹配日历的摘记意想ROUGE,以评估特定日历的准确性;(3)Align F1:在意想ROUGE之前,先笔据相似性和日历接近性对展望摘记和参考摘记进行对都,评估对都后的一致性。

Date F1:商酌生成时候线中日历与参考时候线中真确日历匹配进度。

2. 绽开域TLS

在绽开域TLS的实验中,CHRONOS与几个基线范例进行了比较,包括胜利搜索场地新闻(DIRECT)和重写场地新闻以创建查询用于检索(REWRITE)。

对比之下,CHRONOS通过迭代自我发问和检索关联新闻著述的范例,显贵提高了事件回首的质地和日历对都的准确性,在所筹谋上都朝上于基线范例。

3. 闭塞域TLS

在闭塞域TLS的实验中,CHRONOS与之前的代表性责任进行了比较,包括:(1)基于事件团聚范例的CLUST (Gholipour Ghalandari and. Ifrim, 2020);(2)基于事件图模子EGC(Li et al., 2021)和(3)欺诈大模子进行事件聚类的LLM-TLS(Hu et al., 2024)。

在Crisis和T17这两个经典数据集上的比较死心露馅,CHRONOS达到了与这些责任类似的进展,在两个数据集的AR-2盘算上赢得了SOTA效力,讲明了其在不同类型事件和时候跨度上的强大性能和合适性。

4. 运行时候分析

CHRONOS的另一个上风体当今效力方面。

与雷同基于大模子、但需要处理新闻库中所有著述的LLM-TLS范例比拟,它通过检索增强机制专注于最关联的新闻著述,显贵减少了处理时候。

这种效力的进步使其在推行应用中更为实用,尤其是在需要快速反应的场景中。

案例商量:苹果居品发布时候线

团队潜入分析了模子在处理具体新闻事件时的进展,通过接受具有代表性的新闻事件,如苹果公司的要紧居品发布,随机不雅察到CHRONOS若何通过行远自迩的自我发问和信息检索来生成时候线。

在案例商量中,CHRONOS展示了其随机准确索要要津事件和日历的智商,同期也揭示了在某些情况下可能需要校正的地方,举例对某些事件的遗漏或日历幻觉。

结语

CHRONOS框架通过协调大型话语模子的迭代自我发问和检索增强生成时期,为时候线回首任务提供了一种新颖且灵验的措置决策。

这种范例的中枢在于模拟东说念主类的信息检索经过,通过不休地提议和修起新问题来缓缓潜入贯通事件,最终身成一个全面且连贯的时候线摘记。

实验死心已经充分讲明了CHRONOS在复杂事件检索和构建时候线方面的智商,展示了该框架在推行新闻时候线生成应用中的应用后劲和准确性。

同期,这种迭代发问的检索生成范例是否具有泛化到通用任务上的智商也值得将来进一步商量。

拿破仑曾说:“不想当将军的士兵不是好士兵”,但在现实生活中,想不想当将军和能否当上将军那就是两码子事情。我们扪心自问,参军入伍到部队,有谁不想当军官?我等农村入伍的战士,远离故土和亲人,参军入伍来到边陲,其目的就包含(但不限于)通过部队生活历练,成长为军队干部,借此跳出农门,让子孙后代拥有城市居住权。要实现这个目标,并非我们想象的那么简单。

Reference:

[1] Demian Gholipour Ghalandari and Georgiana Ifrim. 2020. Examining the state-of-the-art in news timeline summarization. In Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics, pages 1322–1334, Online. Association for Computational Linguistics.

[2] Manling Li, Tengfei Ma, Mo Yu, Lingfei Wu, Tian Gao, Heng Ji, and Kathleen McKeown. 2021. Timeline summarization based on event graph compression via time-aware optimal transport. In Proceedings of the 2021 Conference on Empirical Methods in Natural Language Processing, pages 6443–6456, Online and Punta Cana, Dominican Republic. Association for Computational Linguistics.

[3] Qisheng Hu, Geonsik Moon, and Hwee Tou Ng. 2024. From moments to milestones: Incremental timeline summarization leveraging large language models. In Proceedings of the 62nd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), pages 7232–7246, Bangkok, Thailand. Association for Computational Linguistics.

— 完 —新澳门六合彩开奖网站