澳门六合彩官网-澳门六合彩官网 用大模子吃瓜更智能了!阿里通义实验室提议新时刻线回归框架,全面晋升新闻回归效力
你的位置:澳门六合彩官网 > 香港六合彩资料预测 > 澳门六合彩官网 用大模子吃瓜更智能了!阿里通义实验室提议新时刻线回归框架,全面晋升新闻回归效力
澳门六合彩官网 用大模子吃瓜更智能了!阿里通义实验室提议新时刻线回归框架,全面晋升新闻回归效力
发布日期:2024-12-27 16:58    点击次数:164
绽开域和禁闭域TLS都更高效了

面前,大模子不错帮你梳理新闻时刻线了,以后吃瓜就更浅显了!

AI Agent的风,我们赛博乐子东谈主也得吹吹。

这即是来自阿里巴巴通义实验室与上海交通大学的新商议,他们提议了一种基于Agent的新闻时刻线纲要新框架——CHRONOS。

它不仅不错帮你从海量新闻中回归出蹙迫事件,更蹙迫的是,它还不错梳理出明晰的时刻线,以后上网冲浪时千般复杂事件都一目了然。

其中的CHRONOS一词取自希腊外传中的时刻之神柯罗诺斯。

该框架通过迭代多轮的自我发问神色,伙同检索增强生成时期,从互联网上检索有关事件信息,并生成时刻礼貌的新闻纲要,为新闻时刻线纲要生成提供了一种全新的措置决议。

先来一齐瞅瞅几个例子。

比如对于新闻“国足1-0巴林”,CHRONOS粗略回归海量新闻,呈现事件的一脉换取。

对于隐蔽时刻更长的新闻“中国探月工程”,CHRONOS也能聚焦要点事件,呈面前刻线发展,使得用户粗略一目了然。

补都绽开域TLS短板

时刻线回归(Timeline Summarization, TLS)任务是一种当然话语处理鸿沟的经典时期挑战,它旨在从大量文本数据中索要要津事件,并定时间礼貌成列,以提供对某一主题或鸿沟历史发展的结构化视图。

举例,在新闻鸿沟,时刻线回归不错匡助用户快速了解一个新闻事件的一脉换取。该任务不仅条目识别出蹙迫的事件,还需步调略事件之间的时刻关连和因果研究,以便生成一个连贯、精真金不怕火且信息丰富的时刻线纲要。

说明可检索事件的开头,不错将TLS任务细分为禁闭域(closed-domain)和绽开域(open-domain)两个设定:在禁闭域TLS任务中,时刻线是从一组预界说的、与特定主题或鸿沟有关的新闻著述中创建的,而绽开域TLS指的是从互联网上平直搜索和检索新闻著述来生成时刻线的经过。

昔时的使命东要连合于措置禁闭域上时刻线生成问题,而绽开域TLS则需要雄伟的信息检索和筛选才略,以及在莫得全局视图的情况下识别和建造事件之间研究的才略,为这项任务提议了新的要乞降挑战。

迭代检索的CHRONOS框架

为了应酬上述挑战,团队提议CHRONOS框架,通过迭代发问进行有关事件检索,生成准确、全面的时刻线纲要,粗略有用地措置绽开域和禁闭域两种设定下的TLS任务。

1. 动机

时刻线生成的中枢在于建造事件之间的时刻和因果关连。

每个新闻事件都不错被暗意为一个不同的节点,任务的标的是建造这些节点之间的边,以展示它们的有关性,并最终酿成一个异构图,从主题新闻的节点脱手。

因此,通过一个检索机制来检索有关的新闻著述,不错有用建造这些边,酿成事件之间的研究。

2. 轮廓

CHRONOS讹诈大模子的才略,通过模拟东谈主类信息检索的经过,即通过提议问题、基于检索阻挡进一步提议新的问题,最终网罗对于有关事件的全面信息并回归为时刻线。

CHRONOS包括以下几个模块:

自我发问 (Self-Questioning):领先搜索粗粒度的新闻布景信息,然后迭代地提议问题,以检索更多有关新闻。

问题改写 (Question Rewriting):将复杂或发达欠安的问题明白为更具体、更易检索的查询。

时刻线生成 (Timeline Generation):通过团结每一轮检索生成的时刻线往复归一个超过蹙迫事件的时刻线。

3. 自我发问3.1 粗粒度布景调研

在自我发问的运转阶段,CHRONOS使用标的新闻的标题行为要津词进行搜索,以网罗与标的新闻最平直有关的信息。

这些信息组成了新闻布景(News Context),为自我发问打下初步基础。

3.2 发问示例聘请

在粗粒度布景调研之后,CHRONOS讹诈大模子的凹凸体裁习才略,通过一丝样本领导来率领模子生成对于标的新闻的问题。

为了评估问题样骨子量,引入了时序信息量(Chrono-Informativeness, CI)的主见,用来推敲模子提议的问题检索与参考时刻线对都事件的才略,即高CI值的问题更有可能率领检索到与标的新闻事件有关的著述,用检索生成的时刻线和参考时刻线中包含日历的F1分数进行推敲。

基于最大化问题集时序信息量的标的,构建一个“新闻-问题”的示例池,用于率领新标的新闻的问题生成。

对于每个新的标的新闻,通过余弦相似性动态检索与标的新闻最相似的样本,确保了样本的凹凸文有关性和时刻信息的准确性。

3.3 迭代发问

CHRONOS通过连气儿迭代发问,冉冉深远探索事件的细节。

每一轮迭代都基于前一轮的检索阻挡,以发现新的问题和信息,直到满足时刻线中事件数目或达到最大迭代次数。

3.4 问题改写

查询改写(Query Rewriting)是检索增强生成中常用的优化步调。

在CHRONOS框架中,团队通过对运转发问阶段产生的时时或复杂问题改写为2-3个更易于检索的子问题,粗略生成更具体、更有针对性的查询,从而提高搜索引擎的检索成果。

他们雷同在领导中加入一丝样本,率领大模子进行有用改写,将复杂问题编削为更具体的查询,同期保抓问题的原始意图。

3.5 时刻线生成

CHRONOS通过两阶段生成完竣的时刻线回归:生成(Generation)和团结(Merging)。

生成:通过分析每一轮检索到的新闻著述来识别要津事件和详备信息。讹诈大模子的表现和生成才略,索要每个事件的发诞辰期和有关细节,并为每个事件撰写精真金不怕火的描绘。这些事件和描绘被组织成初步的时刻线,按照时刻礼貌成列,为后续的团结阶段提供基础。

团结:将多轮检索生成的初步时刻线整合成一个连贯的最终纲要。这仍是过触及对都不同时间线中的事件、措置任何日历或描绘上的突破,并聘请最具代表性和蹙迫性的事件。

全新数据集OPEN-TLS

为了评估TLS系统,商议团队还网罗了由专科记者撰写的对于近期新闻事件的时刻线,构建了一个名为Open-TLS的新数据集。

与以往禁闭域的数据集比较,Open-TLS不仅在数据集范畴和内容上愈加千般化,隐蔽政事、经济、社会、体育和科学时期等多个鸿沟,况且在时效性上更具上风,为绽开域TLS任务提供了一个更全面和更具挑战性的基准。

在《神农百草经》中,就将菊花是为了上品药材。从其品类入手,菊花包括野菊和家菊两大类,在家菊中,比较著名的就有杭白菊以及杭黄菊,白菊花在平肝明目方面所发挥的功效更为突出,可用于调理头晕头痛等相关不适,而黄菊花的味道较苦,具有更突出的清热功效,多用于改善感冒发热等相关病症。

汗是由汗腺细胞代谢产生的含盐体液,而引起汗腺活动的一般刺激是热。汗液中的水分是从哪里来的?除了血液中的自由水外,就是贮存在身体各处的结合水。水在人体中所占比例很大,大概有70%左右,这就是汗液的主要来源。

实验阻挡

1. 实验设定

实验基于GPT-3.5-Turbo、GPT-4和Qwen2.5-72B辞别构建CHRONOS系统,评测绽开域和禁闭域两个设定下TLS的性能发达。使用的评忖度划主要有:

ROUGE-N: 推敲生成时刻线和参考时刻线之间的N-gram叠加。具体包括:(1)Concat F1:通过将悉数日历纲要相连起来算计ROUGE,以评估举座的一致性;(2)Agree F1:仅使用匹配日历的纲要算计ROUGE,以评估特定日历的准确性;(3)Align F1:在算计ROUGE之前,先说明相似性和日历接近性对展望纲要和参考纲要进行对都,评估对都后的一致性。

Date F1:推敲生成时刻线中日历与参考时刻线中果然日历匹配进程。

2. 绽开域TLS

在绽开域TLS的实验中,CHRONOS与几个基线步调进行了比较,包括平直搜索标的新闻(DIRECT)和重写标的新闻以创建查询用于检索(REWRITE)。

对比之下,CHRONOS通过迭代自我发问和检索有关新闻著述的步调,权贵提高了事件回归的质地和日历对都的准确性,在所蓄意上都跨越于基线步调。

3. 禁闭域TLS

在禁闭域TLS的实验中,CHRONOS与之前的代表性使命进行了比较,包括:(1)基于事件团聚步调的CLUST (Gholipour Ghalandari and. Ifrim, 2020);(2)基于事件图模子EGC(Li et al., 2021)和(3)讹诈大模子进行事件聚类的LLM-TLS(Hu et al., 2024)。

在Crisis和T17这两个经典数据集上的比较阻挡裸露,CHRONOS达到了与这些使命访佛的发达,在两个数据集的AR-2谋略上获取了SOTA成果,讲明了其在不同类型事件和时刻跨度上的雄伟性能和合乎性。

4. 运行时刻分析

CHRONOS的另一个上风体面前效力方面。

与雷同基于大模子、但需要处理新闻库中悉数著述的LLM-TLS步调比较,它通过检索增强机制专注于最有关的新闻著述,权贵减少了处理时刻。

这种效力的晋升使其在执行应用中更为实用,尤其是在需要快速反应的场景中。

案例商议:苹果家具发布时刻线

团队深远分析了模子在处理具体新闻事件时的发达,通过聘请具有代表性的新闻事件,如苹果公司的首要家具发布,粗略不雅察到CHRONOS若何通过由表及里的自我发问和信息检索来生成时刻线。

在案例商议中,CHRONOS展示了其粗略准确索要要津事件和日历的才略,同期也揭示了在某些情况下可能需要校正的场地,举例对某些事件的遗漏或日历幻觉。

结语

CHRONOS框架通过伙同大型话语模子的迭代自我发问和检索增强生成时期,为时刻线回归任务提供了一种新颖且有用的措置决议。

这种步调的中枢在于模拟东谈主类的信息检索经过,通过不休地提议和薪金新问题来冉冉深远表现事件,最毕生成一个全面且连贯的时刻线纲要。

实验阻挡已经充分讲明了CHRONOS在复杂事件检索和构建时刻线方面的才略,展示了该框架在执行新闻时刻线生成应用中的应用后劲和准确性。

同期,这种迭代发问的检索生成步调是否具有泛化到通用任务上的才略也值得将来进一步商议。

Reference:

[1] Demian Gholipour Ghalandari and Georgiana Ifrim. 2020. Examining the state-of-the-art in news timeline summarization. In Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics, pages 1322–1334, Online. Association for Computational Linguistics.

[2] Manling Li, Tengfei Ma, Mo Yu, Lingfei Wu, Tian Gao, Heng Ji, and Kathleen McKeown. 2021. Timeline summarization based on event graph compression via time-aware optimal transport. In Proceedings of the 2021 Conference on Empirical Methods in Natural Language Processing, pages 6443–6456, Online and Punta Cana, Dominican Republic. Association for Computational Linguistics.

[3] Qisheng Hu, Geonsik Moon, and Hwee Tou Ng. 2024. From moments to milestones: Incremental timeline summarization leveraging large language models. In Proceedings of the 62nd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), pages 7232–7246, Bangkok, Thailand. Association for Computational Linguistics.

— 完 —澳门六合彩官网