月产8000篇新闻稿 大数据&人工智能助力本地新闻

原标题:月产8000篇新闻稿 大数据&人工智能助力本地新闻

来源:cjr.org

作者:Nicholas Diakopoulos

编译:负暄

编辑:罗布君

编者按

在美国,本地新闻市场疲态渐显,根据皮尤研究中心(Pew Research Center)的数据,2003年到2014年间,美地方报纸发行量下降了27%。

1996-2015美国新闻报纸停刊地理位置图

但也不是没有解决方案。有人认为,大数据及人工智能可能会让本地新闻渡过难关。

的确,算法、大数据、人工智能,这些带有科技感的词汇早已入驻新闻界。它们改变了新闻的传统生产方式,也带来纷争。难以揭开的“黑箱”幕布,自我成长的神经网络,人类该如何利用它们报道新闻?

尼古拉斯·迪亚科普洛斯(Nicholas Diakopoulos)是美国西北大学(Northwestern University)传播学院的助理教授,也是哥伦比亚新闻评论(Columbia Journalism Review)新闻与算法主题的撰稿人。这一次,他把目光投向了一个特别的新闻项目,该项目曾获得2018年度谷歌数字化新闻创新基金(Digital News Innovation Fund)的注资。

该基金网站上评论道:“以这种方式对新闻报道进行大规模本地化,可以为许多区域性媒体提供高质量、高容量的内容,从而对新闻生态系统有极大益处。在预算压力越来越大的情况下,这将给本地媒体行业带来重振的希望。”

是什么项目让学界和业界都甚为肯定?传媒研究(xjbcmyj)综合相关资料进行了编译,带你一探究竟。

最近一波新闻业裁员潮提醒了我们:数字媒体仍然没有获得可持续的经济平衡。地方新闻业的未来看起来尤为黯淡,一些美国社区被认为是“新闻沙漠”。

但也不是没有解决方案。有人认为,数据新闻以及人工智能,可能会让本地新闻渡过难关。

雷达(记者、数据和机器人)项目[The RADAR (Reporters And Data And Robots) project,下文简称“雷达项目”]是由英国新闻协会(UK Press Association)和伦敦一家名为Urbs Media的初创公司合作推出的。它的团队只有五名数据记者和两名编辑,但是每月平均可撰写大约8000篇英国本地新闻。雷达项目利用技术的力量向媒体提供基于事实的新闻报道,许多本地媒体机构和雷达项目开展了合作。

雷达项目标志

为了生成本地化报道,雷达项目利用了基于地理区域的数据集,这是由政府公开的,也是完全免费的。每位数据记者每周大约将两篇报道开发为数据模板,包括将数据转换为特定位置文本的if-then-else逻辑规则。不同报道的核心结构可能有些类似,但是细节会根据本地内容来书写。

雷达项目记者的任务首先是从数据中找出不同的角度和情节,然后再添加背景及国家信息,将其放置在一个具有基本结构的数据模板中。用“AI机器人”作为“生产助理”帮助他们撰写新闻,使模板中的文字信息更加本地化。

每周,一个数据模板可以被记者用来生成大约200篇关于特定地区的报道。

当地媒体有时会直接刊发雷达项目提供的新闻,有时则把它们当作草稿,进行调整以增强本地内容相关性。雷达项目的主管加里·罗杰斯(Gary Rogers)坦言,通过统计2018年10月的内容,他们发现,纸质出版物会重新审视大约一半的新闻报道,而在线出版物通常会重审五分之一的报道。

虽然原始版本的雷达项目新闻包含了国家背景,但如果记者合理利用,对于写作一篇与社区息息相关的本地报道仍是有很大帮助的。这需要当地记者做好报道的准备——是的,记者需要做更多的工作才能使最终的新闻更为独特,在媒体市场中也更有竞争力。

JPI Media是一家与雷达项目有合作的新闻媒体公司,该公司的蒂姆•罗宾逊(Tim Robinson)表示,这个项目对新闻编辑部有帮助:“它让我们能够报道一些我们可能根本无法报道的主题。” JPI Media发布的95%的雷达项目新闻报道,只是对它们做了一些细微调整,并添加了能引起共鸣的标题。大量引入雷达项目新闻报道后,JPI Media网站页面浏览量的已经得到了快速增长。

雷达项目成功的关键在于,记者首先确定数据中哪些角度、趋势或异常值(outliers)具有新闻价值,并为不同版本的文章构建模板。然后,使用人工智能润色报道。如果需要,本地记者可以自行编辑内容以提高本地相关性。

雷达使用的政府数据集有助于寻找医院、街头犯罪、消防或教育等方面的市政问题。“他们对地区媒介议程的理解似乎与我们感兴趣的内容非常一致。”罗宾逊解释道。可以通过雷达项目每周在Twitter发布的公告了解他们所涉及内容的范围。这不是一件小事,这些内容正在填补资源不足的媒体机构在本地报道方面的空白。

雷达项目Twitter公告

使用政府开放数据集的另一个好处是它们是免费的。政府已经投入资金和精力来收集数据,雷达项目利用这些数据为新闻编辑部创造价值,而不需要额外付费。雷达项目目前还不打算自己收集数据,罗杰斯解释说:“在公共数据中,我们可以得到的东西太多了。有些数据我们甚至连碰都没碰过。”

得益于2018年谷歌数字新闻计划(Google Digital News Initiative)的资助,雷达项目最初是免费提供服务的。但现在,它也在寻求可持续发展,并开始与付费客户签约。它的定价模式不是根据新闻产出数量收费,而是根据媒体客户希望覆盖的当地区域范围的大小收费。

(图源:radarai.com)

如果雷达项目能顺利向付费服务转型,这种可持续发展的模式便是有借鉴意义的,即只雇佣5名数据记者,就能写出覆盖英国全境的本地新闻报道。

负能量内容引青少年入歧途,社交媒体该如何负责?

机器学习,是新闻业的未来吗?

如何用产品思维打造内容订阅 | 海外平台付费图鉴返回搜狐,查看更多

责任编辑:

平台声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
阅读 ()
推荐阅读