东洛货丹
许学士
三千功满去升天,
一住人间数百年。
华表他时却归日,
沧溟应恐变桑田。
一文读懂诗词大数据(二)
发布时间: 2024/12/2 0:00:00 阅读:575次 分享到

诗词大数据既包含诗词知识、理论和作品,又涉及计算机硬软件、网络、信息传播、云计算、人工智能等专业技术,而用户群体年龄相对偏大,所以其基本概念深奥、功能复杂繁琐、实际操作困难,此处化繁为简,结合具体案例,对它做一个尽可能通俗易懂的解读。

一、诗词大数据基本概念


(一)巨量原始数据目前,全国有各级诗词组织上千家,诗友数量保守估计达三四百万人;诗词传播渠道,如网站、杂志和各种自媒体等,总量有数千之多。按诗友人均每10天发表一首作品、每首作品5个发表渠道计算,10天将产生约千万条原始数据。诗词作品常见属性标准达数十个,如作者、时间、体裁、题材、用韵、格式等。

(二)海量交互数据巨量的原始数据本身是静态的、相互独立的,然而这些数据一旦被传播、读取和运用,就会产生总量是原始数据千万倍的交互数据。比如,巨量诗词作品中的任意一首,本身的原始数据量是1条,如果这首作品按不同属性标准,通过不同渠道,在某一不确定的时段内,再在巨量的诗友之间传播和交流,交互数据就会无限地剧增。

(三)数据计算加工海量的诗词数据又会持续投入系统的科学存储、复杂计算和加工处理,持续产生各级各类有待读取和运用的备用数据,从而不断优化、提升诗词大数据的现实功能和潜在价值。诗词大数据借助持续更新的计算机硬件设备,始终保持强大的相应能力。然而,诗词数据的存储、计算和处理,离不开高性能的计算机硬件,而这需要大量的物力和资金支持。

(四)数据再生拓展诗词大数据的高端目标是通过数据的释放、读取、传播、交互和运用,服务广大诗友诗词生活、诗词组织壮大、诗词文化传承和发展。诗词云团队将持续推出、升级和更新各种性能的实用小程序,如同微信、支付宝和今日头条等,让用户便捷搜索和快速提取所需信息,并主动推送诗词作品。团队也亟需投入更多人力和物力,持续开发不同的诗词大数据配套软件,来满足不断发展的个性化场景需求,实现诗词大数据核心功能同步提升和服务领域全方位拓展。

二、诗词大数据核心功能


诗词大数据核心在于高效存档与永久保存,其精髓在于智能自动提取信息。

(一)档案整理计算机对诗词数据进行系统分析和科学整理,并确保其永久保存。在这个过程中,诗词作品会从固定元素与动态元素两方面进行规整,静态元素指作品本身内容,动态元素指作品传播情况。静态元素即作品内容被分解为数十个存储单元(如标题、注释、体裁、背景、时间、主题等),其中,仅主题就分成上万个。动态元素指作品本身的传播情况,即作品所发表平台和参赛信息,如某公众号、某杂志、某网站等,阅读人次等,参赛级别、所获奖项等。档案整理功能一方面长久存储诗词数据,使得后人在学习和创作时能快速搜索到所需作品;另一方面,该功能原则上将动态元素较好的作品前置,使得大部分人作品容易被搜索到且排列靠前的几率更高,从而真正实现诗词作品的传承。例如:当我们创作了一首关于天安门的诗词,得益于诗词大数据系统的详细分类存储功能,无论经过多长时间,只要以天安门作为关键词进行搜索,这首作品都能被迅速找到。例如:搜索北京 天安门将会 检索出北京区域 写天安门的作品;如搜索北京 中华诗词学会 天安门 ,系统会检索出北京区域 中华诗词学会会员 写天安门的作品;若搜索中作品中还提及了等具体元素,将进一步缩小搜索范围,直击目标内容。

(二)主动推送诗词大数据的个性化推荐系统,能够根据用户的习惯和偏好,主动推送已经进入大数据的相关类型诗词作品。如用户经常浏览西江月、水调歌头,定风波等词牌,则系统会主动推送相关词牌作品;如用户作品集中在某一体裁类型,系统也会推送相关体裁作品;如用户常创作或浏览某些主题的诗词,系统会推送这一主题类型作品,如用户是中华诗词学会会员,系统也会推送中华诗词学会会员的作品。

三、诗词大数据建设思路


建设诗词大数据是时代赋予我们的光荣使命,也是一项极为艰巨的任务,经费是影响其成效的关键一环。以开发主动推送程序为例,启动资金达百万级别,后续维护成本也相当高昂。为此,我们设想总的建设思路:依靠大众支持,回馈大众需求。具体做法是:每首作品收取5个云币(与人民币等值),并为志愿者的服务工作提供合理报酬。

四、诗词大数据建设流程


诗词大数据建设基本流程如下:

(一)构建个人大数据作者本人对保存在个人作品库的作品进行初步筛选,自愿选择优质作品添加至个人诗词大数据草稿库。作者在草稿库中按照大数据建设要求对作品进行格式等整理,确认无误后, 正式提交到个人诗词大数据库,需支付 5 云币/首。作品一经正式提交,不可更改。

(二)平台初审平台安排专业全员对作者提交入库的作品进行格式、内容、体裁、数据关联、标签等方面的初步审核,确定作品传播情况。

(三)系统复审系统对初审通过的作品进行复审,如查重、生成作品证书,以保护作品的原创性,一旦发现并确认为非原创作品,则不予收录。

(四)推送存档通过最终评审的作品可推送至相应的团体或区域大数据并存档。如,作品有意向加入江苏省诗词协会团体大数据,可将作品推送至该团体大数据库中;作品有意向加入安徽省区域大数据,可将作品推送至该区域大数据库中。但凡加入团体或区域诗词大数据的作品,后期则往往被高频提取、推送,从而更多地参与诗友交流和互动。


特别说明:

为更个性化满足数字化时代广大诗词爱好者、学习者、研究者的个性化需求,高效推进诗词学习、创作、发表、传承的工作进程,特推出诗词云币功能。

诗词云币是时代的产物,也是诗词网络联动的线上虚拟币,可适用于购买网课、畅用诗词工作、个性化诗词大数据建设以及采购相关平台服务。

(一)云币的获得方式:

1)在线充值:充值金额和获取的云币比例为11。如:充值1元获得1云币。

2)平台赠送:

根据用户对平台及大数据建设的贡献,平台方提供免费云币赠送。

用户自用或销售平台方提供的共创产品,平台方将赠送相应价值的云币。如:诗词云团队与江苏今世缘股份有限公司共同推出三款诗词界专属诗人酒诗词云?//。自用或影响身边的人优惠购共创酒即可赠送同等数量云币,例如买 1000 元酒就送 1000 云币。

(二)云币的用途:

创建个人大数据,每首作品收费 5 云币;个人将作品推送至团体,又相当于在团体中收藏,同样收费 5 云币/首。此后陆续开发的新产品均一并免费使用,作品将永久存留。一次投入,永远受益。诗词云作为一个功能全面的诗词作品传播网站,提供包括作品投稿、团体网站管理、内容推送、评审及大赛征稿等服务。诗词大数据则是在此基础上开发的系统。两者共同促进诗词文化的传播与发展。

在线人数:2970 今日访客数: 275938 今日页面浏览量: 1004553 总页面浏览量: 333060064
Shiciyun.com All rights Reserved @2021 江苏书妙翰缘科技发展有限公司 苏ICP备12063804号-2

地址:江苏省淮安市清江浦区文庙新天地C6-1 翰缘书院 技术服务QQ:1371234137 965663877 2317365119
诗词云平台QQ群:126405582 联系电话:0517-83761866
翰缘诗意生活馆
诗词云公众号