智能写作-机器写作的主流技术综述

编辑:pitaya02        日期:2020-09-21

机械写作指的是从原始新闻材料到生成新闻材料的过程,根据新闻材料的不同可分为两大类:

一、从资料到文本的写作方式,如:从股市资料进行金融分析,从体育竞赛资料进行体育战报。

二、从大量的文字中提取摘要,例如:搜索引擎对同一主题的新闻进行摘要,生成新闻主题卡等。

就文本生成技术的类型而言,目前的主流技术是模板写作和文本生成。前一种是目前主流的机器新闻写作模式,所谓模版写作就是由经验丰富的媒体专家,或机器从历史文本中挖掘出标准的写作结构和句式。再用内容语料库、数据分析的结果来填充这些模板,就会得到格式相似但言之有物的模板新闻,因为这样的新闻的读者更注重内容而非句式和文采,从而能满足他们的阅读需要。就拿地震新闻自动撰写流程为例,模版新闻在设置好新闻模块和句子结构后,只需提取相应的数据,即可完成新闻写作。火龙果智能写作

模版生成式写作看起来很简单,模板就位就可以了。但是实际上是为了使新闻准确地表达数据,抓住焦点,同时又增加了可读性。有几个难题需要解决:

如何对数据进行分析以获得关键的结果。举例来说:篮球赛10个明星,200个进球,上万个数据,那么在短短的200字的报告中,应该呈现哪些数据?

2.根据数据分析的结果,如果用自然语言描述,就不会有千篇一律的重复。举例来说:足球比赛同样是 A队赢 B队,如何分别说5:0和1:0?火龙果智能写作

三、要追求一种图文并茂的阅读体验,就必须为文字片断配上适当的图片,而90分钟长的视频,图片来自哪里?

而且这些问题的答案大多隐藏在历史文章和数据之中,需要机器来挖掘新闻工作者写作的模板和规律。第二章将结合《睿报》的实践进行介绍。火龙果智能写作

模版写作使用针对特定主题类型的写作,但在多变多变且主题不固定的领域中,需要使用文本生成技术,例如:写诗,为图片配上文字。目前,小冰在微软的诗作中是一个比较优秀的机器诗人。可欣赏的段落:火龙果智能写作

文字产生不需要人工指定写作模板,通过神经网络直接从大量的文字中学习到写作技巧,然后根据新闻素材,生成最终的文字。当前的文本生成技术还不够成熟,只能用很短的单词来生成文本,而不能用很长的句子来生成。

图象文本描述的神经网络模型

火龙果智能写作是全球第一款中英双语语法检查校对产品,运用火龙果智能写作技术进行错别字文本校对,除错别字校对以外,还可以对语法、标点等进行校对。

火龙果智能写作官网https://www.mypitaya.com

积极拥抱变化,才能更好的应对这个时代


智能写作-机器新闻写作的起源与发展