目录

  • 1 第一单元:认识计算机
    • 1.1 计算机初识
    • 1.2 计算机的特点与分类
    • 1.3 计算机的新技术
    • 1.4 网络成瘾症 — 小心网有毒
    • 1.5 小心网络焦虑,它是慢性病!
  • 2 第二单元:计算机的硬件和软件
    • 2.1 计算机系统的结构
    • 2.2 常见的计算机硬件(一)
    • 2.3 常见的计算机硬件(二)
    • 2.4 计算机软件系统 — 系统软件
    • 2.5 计算机软件系统 — 应用软件
  • 3 第三单元:计算机中的数据处理(一)
    • 3.1 神奇的二进制
    • 3.2 八进制与十六进制
    • 3.3 文字数据在计算机中的表示
  • 4 第四单元:文件与多媒体
    • 4.1 文件与文件管理方式
    • 4.2 计算机中常见的文件类型
    • 4.3 图像文件的格式与存储原理
    • 4.4 音频文件的格式与存储原理
    • 4.5 视频文件的格式与存储原理
  • 5 第五单元:认识计算机网络
    • 5.1 网络是什么
  • 6 文字处理
    • 6.1 新题库一
    • 6.2 新题库二
    • 6.3 新题库三
  • 7 PPT新题库解析
    • 7.1 新题库一
    • 7.2 新题库二
    • 7.3 新题库三
  • 8 Excel新题库解析
    • 8.1 认识Excel
      • 8.1.1 公式和数据
      • 8.1.2 图表
    • 8.2 题库练习
      • 8.2.1 新题库一
      • 8.2.2 新题库二
      • 8.2.3 新题库三
文字数据在计算机中的表示

第三课时:文字数据在计算机中的表示

[课时目标]

  1. 了解中文和英文在计算机中的表示方法

  2. 了解区位码、国标码以及机内码的相互转换


[文字数据和字符集]

文字数据是无法直接在计算机中表示和存储的。

通常为了方便处理文字,便需要对文字规定一定的表示方法,这些表示方法的集合也叫字符集,目前较为常见的字符集有:ASCII、UTF-8、UTF-16、GBK、GB2312等。


[西文字符的表示 — ASCII码]

西文字符通常使用一个数字代替一个符号,共支持128种字符,称之为ASCII码。

ASCII码称之为美国标准信息交换码,较为重要的几个码值有:

空格   32

'0'      48

'A'      65

'a'      97


[中文表示的编码]

中文表示、存储以及处理的方案远比西文要复杂的多,需要经历输入、转换的过程,通常可根据过程的不同划分为三种不同的编码,即输入码、国标码以及机内码

输入码:用于输入汉字的编码,分为音码(按拼音输入)、形码(按笔画或者形状输入)以及音形码(二者结合)

国标码:在还未存入计算机之前中文文字的中间状态。

机内码:在计算机当中存储、表示和处理文字的编码,同一个文字在不同的CPU中会产生不同的机内码。


[区位码]

区位码是一种特殊的输入法,将大量的文字存入表格之中,一行为区,一列为位,各有编号,区号和位号能准确确定一个汉字。如下图:

例如图中,“希”字在第47区,第03位。


[区位码和国标码的转换]

区位码转换为国标码的公式为:

国标码 = 区位码 + 2020H

Tips:

  1. 此处区位码的区号和位号均为16进制数。

  2. 2020H是指区号和位号各加20H


[例]已知某文字的区位码为5041H,求其国标码

国标码 = 5041H + 2020H

           = (50H + 20H) , (41H + 20H)

           =   70H ,61H

           =  7061H


[国标码向机内码的转换]

国标码转机内码的公式为:

机内码 = 国标码 + 8080H = 区位码 + A0A0H

此处注意点与上同,不再赘述。

[例]已知某文字的区位码为5041H,求其机内码

国标码 = 5041H + A0A0H

           = (50H + A0H),(41H + A0H)

           =  F0H ,E1H

           = F0E1H