当前位置: 东星资源网 > 文档大全 > 寄语 > 正文

[图书标注系统的比较分新] 图书标注

时间:2019-02-11 来源:东星资源网 本文已影响 手机版

  [摘要]回顾图书标注的发展历史,介绍基于标签的图书标注系统的机制与优势;选取国内外共计三类10个图书标注系统进行实例分析,从标注主体、标注目的、标注功能和标签处理三个方面总结各类系统的特点;最后提出完善图书标注系统的建议,以期为其未来发展提供些许参考。
  [关键词]社会分类法 社会标签 图书标注系统
  [分类号]G250.76
  在Web2.0时代中,以标签(tag)为关键词,对网络信息进行描述的社会分类法应运而生,并被广泛应用于图书、网页、视频、图像、光盘等各类型资源的标引和聚类。目前,基于标签的图书标注网站已遍布国内外,并呈现迅猛发展的趋势。
  1图书标注的发展与机制
  1.1图书标注的发展
  1.1.1书面评注阶段在书面阅读时期,读者通常将评注(包括心得、感想、说明、勘误等)以小字或与正文异色的文字书写于图书的左右页边、上下页眉或行间空隙。图书评注早在2000多年前就已出现,最初是直接注于书籍原本上,稍后又出现了针对原书而另成一书的注本,再之后又有了书评,评注内容的传播范围得以扩大。但是书面评注是一种嵌入式评注,可分享性较差,而且一经评注就难以修改。
  1.1.2电子文档评注阶段随着计算机的广泛使用,20世纪下半叶出现了电子文档和一系列阅读软件。这些软件多提供评注(批注)功能,且评注内容存储于本地计算机上。所使用的存储方式可分为嵌入式和分离式,前者将评注内容置于文档内部,后者则将评注内容存放在与文档相关的另一独立文件中。该阶段实现了评注的再编辑,但其内容仍旧难以共享。
  1.1.3基于标签的社会化标注阶段
  随着基于社会标签的社会分类法的出现和Delicious的诞生,基于社会标签的信息组织理念日益深入人心。基于标签的图书标注系统肇始于2005年9月上线的Librarything,之后两年内Shelfari、Bookbump、Gurulib等一系列商业性图书社会编目网站都开发了图书标注功能。部分在线读书网站也纷纷引入图书标注,以Goodreads为代表。应用图书标注系统的还有网络书店,以亚马逊书店(Amazon)为代表。一些图书馆也允许读者为OPAC中的每条书目记录添加标签,并把标签加入到个人图书馆中,在检索书目的同时也能检索标签,如Penntags、Mtager等标注系统。WorldCat等联机书目数据库也已经开通了社会标注功能。图书社会化标注的应用已十分广泛,深受广大用户的认可。
  1.2基于标签的图书标注机制
  基于标签的图书标注的基本流程如图1所示:
  
  用户在系统中查找图书,将其添加到自己的虚拟书架中(或直接在其中创建图书记录),并为之加上标签。每个标签都记录了它的使用主体、内容主体、同时使用的其他标签,既能反映图书的特征、属性,又体现着用户的关注领域和知识结构,可作为个人兴趣的标识。系统首先分出相同的标签,并统计词频(有的对标签变体进行处理);接着分析标签的含义、标签的添加位置、标签的添加者,计算标签问的相关度,自动将达到一定相关度的标签归并,将拥有相同标签的图书归类;并结合用户的标签使用记录,向用户推荐图书和用户群组。其流程主要包括以下三个环节:添加标签、处理标签和呈现标签,由服务器和客户端(浏览器)共同实现。其中服务器负责用户身份验证、统计、归组和标签的审核、处理(统计、分类、聚合、推送)、存储、管理等工作,客户端使用户调用标注功能,显示经过处理后的标签,并使用户享受到系统提供的个性化服务。
  基于标签的图书标注的优势在于:首先是有利于更全面、准确地揭示图书的内容和形式特征:①标签通常是简短、易懂的语词,形式灵活;②某一本书下的多个标签之间呈平行关系,具有同等权重;③标签的数量通常无限制;④添加标签的用户往往已通读过全书,对其内容较为了解,标引的准确度较高。其次,改进了内容交叉、重叠的图书的信息组织。系统通过匹配标签,将相似度较高的标签进行聚类、分组,并通过网络形成互链,使标签问的关联增强,用户可以输入不同的语词,从不同的角度查找到同一本书及与之相关的图书,图书间联系趋于紧密。再次,体现了集体智慧和以人为本的理念:①标签的添加简便,从而能够充分发动广大网络用户的力量,是一种网络协作式、表达个人想法的新型信息组织、揭示模式;②通过了解他人使用的标签,每位用户都能找到志同道合的书友,分享自己的阅读心得和体会,并及时获取自己感兴趣领域的图书信息。第四,有助于查找同属某一主题或在某方面具有相似或相同点的图书。在系统中点击任意一个标签,就能一网打尽使用了该标签的所有图书。最后,标签中包含不少新的术语、名词,动态性强。
  2图书标注系统实例分析
  本文选取三类共计10个典型的具有标注功能的图书网站作为研究对象,分别是:①社会编目网站,包括Librarything(http://www.1ibrarything.con)、Shelfari(http://www.shelfari.con)、WorldCat(http://www.省略)、豆瓣读书(http://book.省略);②在线读书网站,包括Bibsonomy(http://www.省略)、好书网(http://www.haoshu.con)、4020电子书(http://www.省略)、凤凰网读书频道(http://book.ifeng.con);③网上书店,包括亚马逊网络书店(http://www.amazon.con)、孔夫子旧书网(http://www.kongfz.con)。
  2.1图书标注功能分析
  对各图书标注系统的标注功能的比较分析见表1。
  由表1可知:①从标注界面上看,绝大多数系统中,用户无需安装专门的插件即可进行标注。做得较好的系统除了显示用户标注的标签外,还会列出系统推荐的标签,并让用户对他人的标注进行评价(如亚马逊书店)。②从标签排列和显示方式上看,图书信息页一般都显示这本书的标签(至少是热门标签)、被标引数、添加过该标签的用户或群组等标注信息,且大多以标签云或列表的方式显示,按字顺或标注次数排序。做得较好的系统会对热门标签进行分类,区分用户自己的标签和他人的标签,通过多种可视化方式显示标签云的细节(如亚马逊书店)。③从标签规范处理上看,部分标注系统已采取一定措施以提升标签的质量,如Librarything通过“Tagmash”从原始标签中提炼更能概括其含义的概念,逐步抽象构建主题词,并建立关联,最终形成词表。但大多数系统中依旧存在大量同形异义(尤其是缩写词)、异形同义,甚至与图书实际情况不符、错误添加的标签等不规范问题。
  
  2.2与标签相关的服务分析
  对各图书标注系统与标签相关的服务的比较分析 见表2。
  由表2可知:①从标签检索上看,大部分系统支持标签检索,做得好的系统如Bibsonomy还提供相关标签(related tags,与该标签出现在同一本书下的标签)和相似标签(similar tags,通常是该标签的近义、同义词);②从标注说明上看,国外图书标注系统用户帮助栏目建设较好,基本都有FAQ,有的还专门制作了动态的网站使用流程简介或教学视频,如Lihrarything甚至拥有一个关于web2.0概念和系统特有的术语的小百科(wikiThing);③从基于标签的图书推荐上看,有些国内的标注系统尚未开发个性化的图书推荐服务,而国外图书标注系统大都能够充分挖掘标签的关联,利用标签关系开展图书推荐或相似用户推荐服务。
  3各类图书标注系统比较
  3.1标注主体
  三类图书标注系统的标注主体如表3所示:
  
  社会编目网站是为网络用户在线管理自己的书目、分享自己的读书经历和心得而建立的,强调用户的广泛参与,这决定了用户在标注中的主导地位。
  与社会编目网站不同,在线读书网站的每本书下虽然也有标签,但通常不是用户添加,而是由网站管理员或系统自动给出。这是因为这类网站源于电子图书阅读、下载网站,其图书资源由系统发布、提供,而标签正是网络环境下组织网上资源的一种行之有效的手段。标注主体因而转移到系统一方,用户退居其次。
  网上书店是伴随着计算机网络的普及与电子商务的兴起而诞生的网站式书店。图书标注最初只是发行销售方――出版商与作者描述图书属性的手段之一。近年来,部分网上书店逐渐意识到读者、顾客对书店发展的重要影响,采取了一系列吸引措施。而面向读者开放图书标注,正体现了营销者以读者为本的理念。
  3.2标注目的
  三类图书标注系统的标注目的如表4所示:
  
  社会编目网站引入图书标注,主要是为方便用户组织、标识、查找、管理自己在读和读过的书。用户点击某一标签或进行标签检索,使用了该标签的所有图书就一目了然,再进入图书信息页,便能看到该书的所有标注用户,查看其阅读、标注记录,从而找到与自己拥有共同阅读兴趣的人,并从中发现自己喜爱的书;其他用户阅读的书籍也得以分享。此外,用户使用的标签反映了其知识结构和关注领域,因而成为系统个性化图书推荐的依据之一。
  在线读书网站创办较早,应用标签却往往较晚。其目的主要是以标签聚类图书,并以标签作主题词标识图书,从而帮助系统更好地组织图书资源。对用户而言,标签为他们提供了一个新的检索入口。
  网上书店应用标签也是一举多得。一方面便于读者更准确地查找到更多符合自己需求的图书,记住自己的购买意向和记录;另一方面允许图书发行者更全面地揭示图书的属性、特征。系统还可将图书的标签和读者用过的所有标签相匹配,如有相同标签便推荐给读者。这一举措吸引了更多读者,盈利也随之增加。
  3.3标注功能和标签处理
  三类图书标注系统的标注功能和标签处理如表5所示:
  
  社会编目网站的标签排序方式较多,如按标引数、按标引时间、按字顺排序等。标签的相关信息较多,包括标引次数、标引者、与之相关的标签、热门标签等。一般都支持标签检索,标签云运用普遍,种类较齐全,部分系统对标签作了一定的规范化处理。标注功能的使用说明较详尽,标注时列出系统推荐标签、用户曾用标签供参考,标签的更新频率较快。
  在线读书网站中的系统标签和某本图书下的标签均较少,排序方式较单调,有的甚至没有特别的排序依据。标签的相关信息缺乏,部分系统不支持标签检索。多数系统没有标签云,采取自动抽词的方式生成标签,未对标签进行专门的规范处理。少数系统因由管理员添加标签,标签规范度较高。没有或很少提供用户标注的使用说明,标签的更新频率较慢。
  网上书店在这方面呈现两极分化。如孔夫子旧书网不支持用户标注,标签数量少,排列较混乱无序,且质量不高,几乎不提供标签的相关信息,没有标签云和标签检索功能,标签更新频率慢。而亚马逊书店支持用户标注,标签数量多,能显示标签的标引数、相关标签等信息,编制有关于标签和标注功能的详细说明,并对标签进行了若干规范化处理,使用标签云,提供标签检索功能,标签更新频率快。总之,国内的网上书店还任重道远。
  4改进图书标注系统的建议
  4.1拓展图书标注的应用范围
  目前多数网上书店(尤其是国内,如当当网等)尚未引入标注功能,这些网站应根据自身现状,结合亚马逊书店的成功经验,逐步建设、开放以读者为主体的标注功能,同时也允许作者和出版销售机构为图书添加标签,让标签成为用户了解图书信息的重要渠道之一。此外,大型门户网站拥有相当广泛的用户群,其读书频道是向大众进行图书推介的最主要阵地之一,而目前它们可谓有社会标签之名而无其实。门户网站应充分发挥标签自由灵活、共享面广的优势,以加强图书宣传。
  4.2进一步完善标注功能
  多数系统均应加紧编制标签的概念说明和标注功能的使用指南,制定若干基本的标引原则(如尽量避免缩写,少用泛指性语词,尽量使用公众常用词,标引词应真实客观,标引词拼写应保证正确,数字和单字母等类型的标签应在括号内予以说明,合并单复数形式和含连字符的语词,禁用非正规语言)。可以某些概念为例,列出推荐与不建议使用的标签。在用户标引完成点击提交时,可给出建议的标签(如同义词、全称、规范的拼写),且跳出对话框提醒用户核对标签,检查是否出现错误,如有错误应及时提供修改的接口。另外,还可以改进基于标签的检索,如设置精确匹配和模糊匹配,用户可就标签的使用频次、添加时间等属性进行限制等,还可以就标签属性(这里的属性主要指标签的内容属性)实行分面检索。在标注中还可设立“标签关系”选项,建立不同等级的标签域,归并成某一标签的同义词、近义词和反义词集,既方便系统生成相关标签,又便于用户管理标签。可以生成丰富多样的标签云,如书名、作者、出版者、书中事件名、书中机构名、书中人名和地名等标签云,并可考虑改进标签云的标签排列方式,由单一的根据字顺排列向依据标签之问的语义相关度排列转变。
  4.3增加标签推荐算法
  多数系统单纯以标签的被使用次数为依据,筛选热门标签,这样的排序和选择标准不够全面、科学。可考虑推出标签的标引上升次数排名榜、标签排名升降榜;把标签按属性进行分类(如人名、地名、机构名、事件名等),每类再按标引数排序;每类图书的标签可分开显示;随机从标引数少的标签中挑选出若干单独排列,以供用户参考。此外,用户的标注通过率、图书被点击数、图书书目信息被引用数等也应在标签推荐中拥有一定的权重。
  4.4拓宽系统的配套服务
  在图书标注系统中,图书推荐、书目数据导入导出、信息订阅等功能与标注功能一道构成了系统的用户服务体系。如推广Librarything的“不推荐书目”功能,反其道而行,对标引数很少的图书推出分类排行。系统应提高标签的更新频率(目前一些系统,如凤凰网读书频道的热门标签还停留在每周更新的频率上),使用户更加及时地了解标引动态,进而获悉阅读趋势和社会关注热点。还可以加强与其他机构的合作(如图书馆、门户网站、出版机构、学校、科研机构、其他图书标注系统),不断提高自己的知名度,开辟新的信息源以开展书目记录导入服务等。

标签:标注 图书 系统