地方新闻报道不足,BBC是如何试验半自动地方新闻的?

Share
加拿大国际广播及CBC/Radio-Canada版权所有 抄袭举报 网站:www.rcinet.ca 微信ID:radio-canada

在英国广播公司新闻BBC网站上你可以看到一些故事,标示是用“某种自动化”生成的。这些新闻故事是英国广播公司新闻实验室“自动新闻实验”的产物。

加广版权所有www.rcinet.ca微信:radio-canada

英国广播公司新闻实验室,希望在不大幅增加本地新闻团队工作量的情况下,为他们带来丰富的数据驱动的故事讲述。其目的是在有限的地方新闻人力物力的之上,能带来更多相关的本地新闻。

加广版权所有www.rcinet.ca微信:radio-canada

在过去的几个月里,英国广播公司合作开发了一个名为“半自动本地内容”的项目,即Salco(Semi-Automated Local Content) 。

加广版权所有www.rcinet.ca微信:radio-canada

在其中一个试验项目上,罗奥·赫顿和塔姆辛·格林两个开发人员组成的团队尝试每个月生成100多个独特故事,让观众每天都能在直播页面上了解当地医院在急救(Accident & Emergency)上的表现。

加广版权所有www.rcinet.ca微信:radio-canada

Photo by Elijah O’Donnell on Unsplash

Salco将数据转化为故事的五步

Salco将数据处理、故事生成和编辑审批结合到一个简单的“点击”生成过程中。该过程获取原始数据,并根据记者设计的模板自动生成丰富的本地故事。

加广版权所有www.rcinet.ca微信:radio-canada

整个过程大约为5个步骤:

加广版权所有www.rcinet.ca微信:radio-canada

1、处理从英国国民保健系统得到的数据,并提取感兴趣的部分。
2、根据一名资深记者的模板,为每个国民保健机构制作一个文本故事。
3、为每个故事生成一个图形,以BBC的风格产生数据图形。
4、预览每个故事,这样记者就可以核实和批准它们。
5、将每个故事发布到适当的城市或地区的主题页面。

加广版权所有www.rcinet.ca微信:radio-canada
我们知道我们的观众重视当地的故事,但自动生成的故事他们想看的吗?英国广播公司发行和业务发展总监基兰克利夫顿

生成自然语言故事模板

将数据自动转换成散文被称为自然语言生成(NLG)。在这个项目中,BBC求助于阿里亚·NLG工作室,一个第三方工具,它允许记者生成将数据转换成新闻文章所需的复杂模板,然后在样本数据上进行测试,看看不同的输出故事的阅读效果如何。

加广版权所有www.rcinet.ca微信:radio-canada

这个工具允许一个迭代过程,在这个过程中记者可以通过增强模板看到故事是如何改进的。

加广版权所有www.rcinet.ca微信:radio-canada

Photo by Unsplash

生成BBC风格的图形

为了生成文章需要的图表和图像,自动新闻团队利用了英国广播公司为新闻故事添加数据可视化和其他图形的深度工具包(IDT)。

加广版权所有www.rcinet.ca微信:radio-canada

新闻实验室与维护IDT的数据展示团队合作,创建了一个系统,该系统将填充一个描述“数据”图形布局的模板,该模板强调故事中最有影响力的数字。

加广版权所有www.rcinet.ca微信:radio-canada

当最终的故事发布时,数据这将被渲染为图像。IDT深度工具包展现了可以利用现有的基础设施以新颖的方式自动生成模板图形。

加广版权所有www.rcinet.ca微信:radio-canada

记者审核和批准故事

最后,整个流程会在一个简单的出版界面列出了已经生成的故事,并允许它们发送到发布平台。记者能够检查系统所产生的报道的质量和准确性。

加广版权所有www.rcinet.ca微信:radio-canada

当一名记者检查后准备发表这些报道时,实验室会利用英国广播公司的“应用编程接口”,在适合该地区的直播流中生成报道草稿。

加广版权所有www.rcinet.ca微信:radio-canada

最终,负责监管该地区直播流的记者可以在报道到达时发布这些报道。

加广版权所有www.rcinet.ca微信:radio-canada

BBC新闻实验室表示,现在这个流程基本达到了原先的预期。在改进之后,一旦他们对这个流程系统 – Salco制作的报道质量建立了信心,这个过程将完全自动化。

加广版权所有www.rcinet.ca微信:radio-canada
加广版权所有www.rcinet.ca微信:radio-canada

加拿大国际广播及CBC/Radio-Canada版权所有 抄袭举报 网站:www.rcinet.ca 微信ID:radio-canada
转载本台文章需明确标明出处,包括作者姓名和Radio Canada International。
您无权使用Radio-Canada/CBC,RCI和其他新闻机构的图片。
copyright-banner

copyright-banner 加拿大国际广播及CBC/Radio-Canada版权所有 网站:www.rcinet.ca 微信ID:radio-canada
Share
文章分类:因特网与科技
标签:

您看到错别字或其他错误了吗? 点击这里!

@*@ Comments

发表评论

电子邮件地址不会被公开。 必填项已用*标注

注意:向加拿大国际广播电台的网站提交自己的评论,代表着您确认加拿大国际广播电台拥有可以以任何方式对您的评论的任何部分进行复制、播出和公布的权力。 加拿大国际广播电台的立场与您的评论完全无关,您的评论将受到预先编辑,如果符合网络礼仪的准则, 则将获得发表。

则将获得发表。 »

当您在网上论坛表达个人意见时,必须象与别人当面说话一样礼貌,侮辱和人身攻击是不能被容忍的。不同意别人的意见,想法或某个事件是一回事,但不尊重他人是另一回事。杰出的思想不总是一样的 - 这正是使网上对话如此有意思和有价值之处。

网络礼仪是一套指导您进行网上通讯沟通的行为准则,在博客或论坛上发布您的信息之前,阅读和理解这些准则是重要的。否则的话,您有可能被禁止发布信息。

  1. RCInet.ca的网上论坛不是匿名论坛,用户必须注册,提供自己的完整姓名和居住地,这些信息将和用户的评论一起显示出来。如果作者的身份不明确,RCInet.ca拥有不发布用户评论的权力。
  2. 以误导或造成伤害为意图假冒他人身份,是一种严重的违规行为,我们的网站将严禁有此类行为的人发布评论。
  3. RCInet.ca的网上论坛向所有人开放,不分年龄,种族,宗教,性别或性取向。
  4. 属于诽谤、仇恨、种族主义、排外主义、性别歧视或贬低某一民族血统、宗教信仰和年龄组的评论将不会获得发表。
  5. 在网上发布言论时,用粗体书写会被认为是高声呼叫,并有可能被解释为侵略性行为,因为对阅读者来说是不愉快的。任何信息,如果其中的一个或多个字符使用粗体、斜体或下划线(缩写和缩略词除外),将被拒绝。
  6. 严禁使用粗俗、淫秽或令人反感的语言。论坛是公共场所,您的意见可能会冒犯一些用户,严禁使用不恰当的语言发布评论。
  7. 用户之间的相互尊重是必不可少的,侮辱,威胁或骚扰其他用户的行为受到禁止。您可以通过不攻击任何人的方法来表达自己的不同看法。
  8. 交换论点和反对意见是正常辩论的重要组成部分,但它不应变成两个用户之间不顾及其他参与者的私人对话或讨论。这种类型的信息将不会得到张贴。
  9. 加拿大国际广播电台使用五种语言。论坛中的交流必须使用与我们发布的内容相同的语言,或使用两种正式语文之一,即英文或法文。禁止使用除少数几个字以外的其他语言。与主题无关的消息将不发布。
  10. 重复张贴会扰乱讨论的流量,这样的行为不能被容忍。
  11. 禁止在评论中添加图像或其他类型的文件。包括其他网站的链接是可以的,前提是这些链接必须符合网络礼仪。然而,加拿大国际广播电台对链接网站的内容完全不负任何责任。
  12. 如果在您的评论中有一大部分是复制和粘贴别人撰写的内容,即便您标出作者的姓名,这样的行为也是不能被接受的。
  13. 严禁在加拿大国际广播电台的论坛中张贴任何形式的广告或鼓励采取某种行动的呼吁。
  14. 所有的评论和其他类型的内容在被发表前会受到编辑,加拿大国际广播电台保留拒绝发布某一评论的权力。
  15. 加拿大国际广播电台保留可以随时关闭一个论坛的权力,恕不另行通知。
  16. 加拿大国际广播电台保留可以随时修改这一行为守则(网络礼节)的权力,恕不另行通知。
  17. 参与网上论坛,意味着您允许加拿大国际广播电台无限期地在网上发布您的评论,而且也意味着这些信息将被互联网的搜索引擎加以索引。
  18. 如果您要求删除自己已经发布的信息,加拿大国际广播电台没有从网上删除您的信息的义务,我们请您仔细考虑自己的评论以及张贴的后果。

*