卡内基梅隆大学开发AI届的“欧·亨利”,能斩获普利策奖吗?


Hunt cloud network 2天前我要分享

[狩猎云] 7月24日报道(编译:郑毅)

先进的自然语言处理系统,如OpenAI的GPT-2,可以编写人性化语言,令人印象深刻。然而,这种人工智能语言往往缺乏说服力和连贯性。他们最引人注目的特点是他们难以撰写令人信服的作品。人工智能产生的故事通常是通用的,缺乏背景。

为了解决这个问题,卡内基梅隆大学计算机科学学院的科学家们已经设计出一种方法,可以为特定的故事创造更多“多样化”的结局。他们说,研究的关键是培养人工模型,专注于故事的重要短语,并促进非泛词的产生。

“故事情境包括一系列连接人和事件的句子。此任务具有挑战性,因为它需要对上下文中的角色,事件和对象进行建模,然后基于它们生成连贯且合理的结尾。实体的语义及其在不同故事中的关系是一项非常重要的任务,“共同作者写道。 “我们的研究表明,两者的结合带来了越来越多有趣的结局。”p>

该团队使用seq2seq模型(一种学习依赖关系的长期短期记忆递归神经网络架构),并根据目标故事情境创建文本的数学表示,学习单词之间的关系并将其转换为人类可读的文本。为了将关键短语整合到故事的背景中,研究人员使用了一种称为RAKE的算法,该算法根据单词的频率和共现来为短语分配分数,然后根据相应的分数手动对短语进行排序,以及低于特定阈值的短语被丢弃。

为了使模型产生更丰富的结尾,科学家们已经用包含多个五字故事的RocStories数据集对模型进行了升级。为了评估模型,他们使用dist算法计算非重复一元模型(给定文本或语音样本中n个项目的连续序列)、二进制模型(字母、音节或单词等一对连续写入单元)和三元模型的数量(三个连续写入单元)。i写入单位),然后除以一元、二元和三元模型的总数。

在另一个测试中,他们训练了Google的Bert来完成开源故事填充任务,允许Bert在给定两个选项的情况下选择故事的正确结尾,从而将模型与基线进行比较。

那么人工智能的性能如何呢?显然,要获得普利策奖是不可能的。虽然这是在距离测试中最好的,完形填空的正确率已经达到72%,它偶尔会给出一些可笑的结局,如“凯特被自己打破,嫁给了她的男朋友”,或不正确的代词(“凯特”,“他自己的”)。

研究人员承认,需要进一步研究,以确保输出“语义和符号层面的上下文”在逻辑上合理和一致。尽管如此,他们声称他们已经“定量地”和“定性地”表明他们的模型能够超越基线并实现“有意义的”改进。

收集报告投诉

0×251C

【猎云】7月24日报道(编:郑毅)

先进的自然语言处理系统,如OpenAI的GPT-2,可以编写人性化语言,令人印象深刻。然而,这种人工智能语言往往缺乏说服力和连贯性。他们最引人注目的特点是他们难以撰写令人信服的作品。人工智能产生的故事通常是通用的,缺乏背景。

为了解决这个问题,卡内基梅隆大学计算机科学学院的科学家们已经设计出一种方法,可以为特定的故事创造更多“多样化”的结局。他们说,研究的关键是培养人工模型,专注于故事的重要短语,并促进非泛词的产生。

“故事情境包括一系列连接人和事件的句子。此任务具有挑战性,因为它需要对上下文中的角色,事件和对象进行建模,然后基于它们生成连贯且合理的结尾。实体的语义及其在不同故事中的关系是一项非常重要的任务,“共同作者写道。 “我们的研究表明,两者的结合带来了越来越多有趣的结局。”p>

该团队使用seq2seq模型(一种学习依赖关系的长期短期记忆递归神经网络架构),并根据目标故事情境创建文本的数学表示,学习单词之间的关系并将其转换为人类可读的文本。为了将关键短语整合到故事的背景中,研究人员使用了一种称为RAKE的算法,该算法根据单词的频率和共现来为短语分配分数,然后根据相应的分数手动对短语进行排序,以及低于特定阈值的短语被丢弃。

为了使模型能够产生更丰富的结局,科学家们已经使用ROCStories数据集升级了他们的模型,该数据集包含超过50,000个五字故事。为了评估模型,他们使用DIST算法计算非重复一元模型(来自给定文本或语音样本的n个项的连续序列),二元模型(一对连续写单元,如字母,音节,或者单词))和三元模型的数量(三个连续的写单元)并将它们除以一元,二元和三元模型的总数。

在另一项测试中,他们训练Google的BERT完成开源故事填写任务,允许BERT在给出两个选项的情况下选择故事的正确结尾,从而将模型与基线进行比较。

那么人工智能的表现如何呢?显然,获得普利策奖是不可能的。虽然它是DIST测试中最好的,并且完形填空的正确率已经达到72%,但它偶尔会给出一些荒谬的结局,例如“凯特被她自己打破,嫁给她的男朋友”或者不正确的代词(“凯特” “, “他自己”)。

研究人员承认,需要进一步研究以确保输出“语义和符号层面的上下文”在逻辑上是合理和一致的。尽管如此,他们声称他们“定量地”和“定性地”表明他们的模型能够超越基线并实现“有意义”的改进。