第一节 采集网络信息
一、网络信息的定义及分类
(一)网络信息及网络信息资源
广义地讲,信息是物质和能量在时间、空间上,定性或定量的模型或其符号的集合。而网络信息限定了信息传递的媒体和途径,是指通过计算机网络传递的信息,包括文字、数据、表格、图形、影像、声音以及内容能够被人或计算机认知的符号系统。
网络信息资源是指可以利用的各种网络信息的总和。具体地说是指所有以电子数据形式把文字、图像、声音、动画等多种形式的信息存储在光、磁等非纸介质的载体中,并通过网络通信、计算机或终端等方式再现出来的资源。
(二)网络信息资源的特点
1.存储数字化
信息资源由纸张上的文字变为磁性介质上的电磁信号或者光介质上的光信息,使信息的存储、传递、查询更加方便实用,而且所存储的信息密度高、容量大,可以无损耗地被重复使用。以数字化形式存在的信息,既可以在计算机内高速处理,又可以通过信息网络进行远距离传送。
2.表现形式多样化
传统信息资源主要是以文字或数字形式表现出来的信息。而网络信息资源则可以是文本、图像、图表、动画、音频、视频、数据库、数字图书馆等多种形式存在的。文本信息在网络中比重最大,文本与其他几种形式结合起来的多媒体信息占据了最大比重;图像图表形式可以将枯燥的文本、数字具体化形象化;动画是静态图片的新发展,更加形象逼真;音视频形式增强现场感,是其他形式的有利补充和验证。
3.以网络为传播媒介
传统的信息存储载体为纸张、磁带、磁盘等,而在网络时代,信息的存在是以网络为载体,以虚拟化的状态展示的,人们得到的是网络上的信息,而不必过问信息是存储在磁盘上还是磁带上的,这体现了网络资源的社会性和共享性。
4.数量巨大、增长迅速
互联网是连接各国的计算机通信的网络,是一个集各种信息资源为一体的信息资源网。随着网络应用在全世界的普及,政府、机构、企业、个人可以随时随地在互联网上发布和获得信息,因此网络信息资源增长十分迅速。
5.传播方式的动态性
网络环境下,信息的传递和反馈不仅快速灵敏,而且具有动态性和实时性的特点。信息在网络中的流动性很强,加上无线电和卫星通信技术的充分运用,上传到网上的任何信息资源,都只需要短短的数秒钟就能传递到世界各地的每一个角落。
6.信息源复杂、检索难度大
信息资源内容涉及各个领域,包括法律法规、经济、科研、教育、艺术、等方面,包含的文献类型从电子报刊、电子工具书、商业信息、新闻报道、书目数据库、文献信息索引到统计数据、图表、电子地图等。由于网络的共享性与开放性使得人人都可以在互联网上索取和存放信息,同时没有质量控制和管理机制,这些信息没有经过严格编辑和整理,因此良莠不齐,各种不良和无用的信息大量充斥在网络上,形成了一个纷繁复杂的信息世界,给用户选择、检索利用网络信息资源带来了很大的障碍。
(三)网络信息资源分类
按照网络信息资源的组织形式可将网络信息资源分为结构化数据资源,如各类数据库;非结构化数据资源,如各类文本文件。
按照资源的开发主体可将网络信息资源分为科研院所资源、学校站点资源、企业公司站点资源和政府机构站点资源。
按照信息传播采用的网络传输协议可分为WWW网络资源、FTP信息资源等。按照信息内容的传播形式可分为Web信息资源与非Web信息资源。
二、网络媒体的分类
网络媒体按照网站归属与建设目的,可分为上网媒体、政府网站、门户网站、商业网站、企业网站、个人网站、学校网站、非盈利组织网站等。
(一)上网媒体
上网媒体是指传统媒体(包括报纸杂志和广播电台、电视台)创办的网站,如人民网、光明网、中国国际广播电台网站和《光明日报》网站。
(二)政府网站
政府网站主要在网上向公众开放政府部门的名称、职能、机构组成、办事章程、各项文件和档案资料等,公众可以通过网络方便地获得相关信息。同时,电子政务的展开,可以使公众在网上与政府进行各种互动和交流,如在线咨询、在线申报批文等。
(三)门户网站
门户网站一般分综合门户和垂直门户。综合门户网站是网络的大门、停泊站或者入口,一打开浏览器即可登录。集合众多内容,以提供多样服务,尽可能地成为使用者上网首页的网站,是网络世界的“百货商场”或“网络超市”,大而全是其根本特点。例如,新浪、网易、搜狐、腾讯等。
(四)商业网站(电子商务网站)
商业网站(电子商务网站)是指在网上从事商业活动的网站,通过网络利用网站的各种职能赚取利润,例如从事网上商品交易的网站(淘宝网、京东商城)等。
(五)企业网站
企业网站是宣传企业、推销企业,为客户提供更为及时、周到的信息服务的综合平台。根据企业网站的定位和功能需求,主要分类有以下几种。
(1)信息发布型企业网站。将网站作为一种信息载体,主要功能定位于企业信息发布,包括公司新闻、产品信息、采购信息等,用户、销售商和供应商所关心的内容,多用于品牌推广以及与受众沟通。
(2)网上直销型企业网站。在发布企业基本信息的基础上,增加网上接受订单和支付的功能。企业基于网站直接面向用户提供产品销售或服务、改变传统的分销渠道、减少中间流通环节,从而降低总成本、增强竞争力。
(3)综合性电子商务网站。不仅将企业信息发布到互联网上,通过网络销售公司的产品,更重要的是集成了包括供应链管理在内的整个企业流程一体化的信息处理系统。
(六)个人网站
个人在互联网上建立的自己专属的网站,网站内容完全由个人自主设计和发布。发布的内容可以是个人信息,自己感兴趣的文学、音乐等方面的内容。相对于机构设置的网站而言,个人网站不需要受组织或利益团体的制约,拥有更大的自由和空间。
(七)学校网站
学校网站是学校发布信息和外界了解学校的重要窗口,是宣传学校的重要信息化平台,是师生学习的重要园地。
(八)非盈利组织网站
非营利组织是指不是以营利为目的的组织,它的目标通常是支持或处理个人关心或者公众关注的议题或事件。非营利组织的网站运作并不是为了产生利益,主要是希望引起更多民众对某类事件引起足够的关注。
三、网络信息的来源
(一)网络媒体自己采集信息
国家互联网信息办公室会定期公布可供网络媒体转载新闻的新闻单位名称,这些新闻单位具有采编权,比如人民网、新华网等都可以外派记者对新闻进行采访、编辑、加工和发布。而像新浪、搜狐、网易等商业网络媒体和其它网络媒体,是没有采访权和首发权的;但在娱乐、体育等方面由于没有相关规定,这些网络媒体可以充分发挥优势,进行独家采访等。
(二)转载国内传统媒体、其他网络媒体的信息
由于国内传统媒体(如人民日报、新华社等)有着较为严格的质量控制体系与手段,因此,来自于传统媒体的信息,质量是比较高的;依托传统媒体的网络媒体(如人民网、新华网等)中的信息质量也是比较高的。在转载国内传统媒体、其他网络媒体的信息时,应该遵守国家相关法律或规定,注意不要侵犯对方的知识产权等。
阅读与分析2-1 转载国内媒介信息
网易新闻中心
盐城决定关闭响水化工园区
【盐城决定关闭响水化工园区】昨天,本市决定彻底关闭响水化工园区,将陈家港镇列入全市改善农民群众住房条件“十镇百村”试点,加快实现乡村振兴。同时,要举一反三做好全市面上化工整治工作,根据省化工行业整治提升方案,进一步抬高本市化工园区、化工企业整治标准,支持各地区建设“无化区”。
资料来源:盐城晚报 2019-04-05
凤凰资讯新闻
盐城决定关闭响水化工园区
【盐城决定关闭响水化工园区】昨天,本市决定彻底关闭响水化工园区,将陈家港镇列入全市改善农民群众住房条件“十镇百村”试点,加快实现乡村振兴。同时,要举一反三做好全市面上化工整治工作,根据省化工行业整治提升方案,进一步抬高本市化工园区、化工企业整治标准,支持各地区建设“无化区”。
资料来源:盐城晚报 2019-04-05
分析:网易新闻频道与凤凰资讯新闻转发国内盐城晚报的同一信息,标题与内容都没有做任何修改。
在转载国内其他网络媒体的信息时,应注意以下几个问题。
(1) 一定要寻找到信息的源头进行求证。如果该网络媒体也是转发其他网络媒体或媒体的信息,则应该找到信息的源头,这样便于对信息的质量做出判断。
(2)考察该网络媒体是否有登载新闻的资格。如果不具备国家规定的相关资格,应该避免采用其原创性新闻信息。
(3)转载其他网络媒体的信息时,应该取得对方网络媒体的同意,并遵守《互联网新闻信息服务管理规定》的相关规定。
(三)网民自发来稿
网民通过论坛、微博、微信、社群、电子邮件等发布的各类信息,也是网络媒体内容的一个重要资源。这类稿件一般时效性强、内容具有针对性、语言通俗易懂、写法不拘一格。这类稿件除了可以采用外,还可以作为新闻线索。
来源于论坛、微博、微信、社群、电子邮件处的信息鱼龙混杂,属于需要特别加以注意核实的一类信息。重点注意是不是国家规定中禁载的内容、信息内容是否真实,最好能与作者取得联系。
(四)转载国外媒体、网络媒体的信息
目前,国内网络媒体直接转载国外媒体和网络信息的比较少,但在转载国外媒体和网络信息时,要特别注意遵守国家的有关规定,间接编译国外的稿件。
阅读与分析2-2 转载国外媒介信息英媒:中国减税政策促奢侈品牌降价 与外国差价缩小
据路透社4月2日报道,中国上个月表示,将在2019年减税降费2万亿元人民币,制造业、交通运输业和建筑业都将从中获益。
苹果中国区官网上的产品价格4月1日下调,其中一些最新款iPhone手机的降价幅度高达500元。苹果公司拒绝就其价格发表评论。
法国奢侈品企业开云集团4月2日表示,其古驰品牌已经降价3%,而酩悦·轩尼诗-路易·威登集团旗下路易威登品牌的一名女发言人也证实,公司已经于3月29日调整了中国区产品的价格。
她说,路易威登“完全支持中国政府缩小中国与国外价格差距的努力”。
铂金包制造商爱马仕公司也称,公司已经将增值税减让带来的收益让渡给中国消费者,价格从4月初开始下降3%。
报道称,奢侈品品牌近年来逐步缩小了欧洲与中国之间的价格差。在最近这些价格动作之前,汽车制造商宝马公司和梅赛德斯-奔驰公司都表示,在中国税费变化后,一些车型的价格将下降。
分析:本案例就是参考消息网记者根据外媒路透社所改写的稿子。
四、收集网络信息的工具
(一)搜索引擎
搜索引擎是一个对互联网信息资源进行搜索整理和分类,并储存在网络数据库中供用户查询的系统。搜索引擎是用于网上信息资源选择的主要工具,按其工作方式可分为全文搜索引擎和目录索引类搜索引擎。
搜索引擎的统计表明,很多用户在网上搜索只输入一个词来进行查询,这会带来很多不需要的匹配。要进行有效的搜索,需要掌握一定的技巧,下面以百度为例稍作说明。
1.关键字查询
在搜索引擎中输入关键字,然后点击“搜索”就行了,系统很快会返回查询结果,这是最简单的查询方法,使用方便,但是查询的结果却不一定很准确,可能包含着许多无用的信息。为了避免这种问题的出现,请使用更为具体的关键字或多个关键字,搜索引擎反馈的结果会更加准确。
如果想在网络中搜索到相似的图片,也可以通过百度的百度识图,安图搜等进行搜索。
2.语法查询
(1)专业文档搜索filetype:很多有价值的资料,在互联网上并非是普通的网页,而是以Word、PPT、PDF等格式存在。搜索语法为“关键字filetype:文档格式”。
(2)在网页标题中搜索intitle:网页标题通常是对网页内容提纲挈领式的归纳。把搜索范围限定在网页标题中,有时能获得良好的效果。搜索语法为intitle:关键字。例如, “intitle:教学管理”。
(3)在特定网站中搜索site:你如果知道某个网站中有自己需要找的东西,就可以把搜索范围限定在这个网站中,以提高查询的效率。搜索语法为site:网站域名。Site与intitle结合使用,可以得到更好的效果,搜索语法为intitle:关键字site:网站域名。例如,湖南外贸职业学院(网站域名:hnwmxy.com)的老师想快速搜索到学校关于评选2018年新时代“教师风采典型”的通知,可进行这样的搜索:intitle: 教师风采典型site:hnwmxy,com。
(二)微博、微信、论坛
随着大数据和社交网络的火爆发展,社交网络上的信息传播也越来越复杂。主要特点有:一是速度快,信息量大;二是传播即时性强。 许多政府部门、企事业单位都开始利用微博、微信等新媒体,及时发布各类权威信息,尤其是涉及公众重大关切的公共事件和政策法规方面的信息,并充分利用新媒体的互动功能,以及时、便捷的方式与公众进行互动交流。国内互联网行业比较知名的有:
(1)新浪微博,是一个由新浪网推出,提供微型博客服务类的社交网站。用户可以通过网页、WAP页面、手机客户端、手机短信、彩信发布消息或上传图片,通过电脑或者手机随时随地分享给朋友,一起分享、讨论;还可以关注朋友,即时看到朋友们发布的信息。
(2)人民微博,是中央重点新闻网站推出的第一家微博客,同时也是第一家以政务内容为主的微博。在高端政务微博市场享有优势,主要针对政府及类政府机构,提供信息及产品等服务。
(3)微信,是腾讯公司推出的一款即时语音通信软件,用户可以通过手机、平板电脑和网页快速发送语音、视频、图片和文字。微信提供公众平台、朋友圈和消息推送等功能,用户可以通过摇一摇、搜索号码、附近的人、扫二维码方式添加好友和关注微信公众平台,同时微信帮将内容分享给好友以及将用户看到的精彩内容分享到微信朋友圈。微信多为用户自己关注的感兴趣的订阅号,由该订阅号的运营人员进行信息推送。同类的订阅号用户一般只会关注一个或几个,这使得推送给用户的信息会更加受重视。相比于微博上搜索同类资讯或某一话题,用户仍需筛选,微信的信息传递更加精准。
(4)知乎,是一个真实的网络问答社区,社区氛围友好与理性,连接各行各业的精英。用户分享着彼此的专业知识、经验和见解,为中文互联网源源不断地提供高质量的信息。
(5)天涯社区,是以论坛、博客、微博为基础交流方式,综合提供个人空间、相册、音乐盒子、分类信息、站内消息、虚拟商店、来吧、问答、企业品牌家园等一系列功能服务,并以人文情感为核心的综合性虚拟社区和大型网络社交平台。
(三)专业网站
专业网站所提供的信息容量大、内容全面、数据准确。专业网站是最简单、最直接地获取信息的方式。一般来说,网站被用户访问的次数越多,说明该网站上的信息越有价值,而一个网站被链接的数量越多,也可以断定该网站的内容比较重要。从专业网站中获取网络信息时,源网站栏目和目标网站栏目相同或相近,这样可以大大缩短获取网络信息的时间,方便网络编辑工作。
一般专业网站分为新闻信息网站、财经信息网站、教育信息网站、科技信息网站,、网络文学网站等,也可以通过类似“360导航”这类网站访问相应专业网站。
(四)网络数据库和数字图书馆
网络数据库、数字图书馆等具有信息量大、更新快、品种齐全、内容丰富、数据标引深度高、检索功能完善等诸多特点,是经济研究最重要的信息源,也是获取信息的一个有效方式。
SpringerLink是世界上最大的数据库检索系统,也是国际著名的科技出版集团Springer的网络版全文文献服务系统。SpringerLink提供全文服务的文献包括Springer出版的478种科技、医学等学术期刊,20余种世界知名科技丛书和实用型工具书。
(五)RSS订阅
RSS订阅是站点用来和其他站点之间共享内容的一种简易方式,即Really Simple Syndication(简易信息聚合),通常被用于新闻和其他按顺序排列的网站,例如Blog。简单说来就是网站会提供RSS输出来提供内容的更新,用户需要通过RSS阅读器订阅RSS,把关心的信息集中到一起,无需逐个网站浏览,可直接在RSS阅读器上阅读网站的信息,不用打开网站,便于管理,阅读效率高。

