# 信息简史
惠勒——it form bit **万物源于比特,万物皆算法**
/
霍布斯,**数**比火更重要(普罗米修斯给予人类最珍贵的礼物或许不是火、而是排列字母的技术——字母表是信息技术中的奠基)
/
**信息论**(不确定性-熵 与 随机性)与**控制论**(反馈)
/
**计算**(差分机)——**编码**(词典)——**通讯**(鼓与烽火、口语与文字、电网与互联网)——**储存**(物理到数字档案)
/
生命的核心是信息、字词和指令——生命&机器(有机体的去魅)
生物**基因**——>**迷因**(meme)——文化的基因(道金斯《自私的基因》)
/
**信息过载**与**意义网络**
## 引言
**Q:什么是信息?**
电话(有线-电)、无线电广播、电视信号……传输的是什么?用什么单位进行计数?
如何打包&压缩信号,更快传输?
电子与电信产业重要节点——
**硬件**——1948年,贝尔电话实验室——**晶体管(transistor)**——电子技术微型化与普遍应用(固体半导体,以电信号控制开关、调制信号等等,类比大脑神经元细胞)

**基础**——贝尔实验室数学研究组的香农——《通信的数学理论》——**测量信息的单位:比特**——逻辑与电的结合——信息论
信息对各个学科的渗透——数学+电气工程、计算机科学、生物遗传学(DNA编译)、货币金融(全区网络比特币)、物理-量子物理(或许信息是世界的本质!比物质存在更加基本,比特才是不能再分的核心——宇宙或许是一台巨大的信息处理器)
## 1 古老的信息编码与传递
**会说话的鼓——似是而非的编码**
古老的信息传递方式——物理编码,快速跨越空间传播
eg. 旗帜、号角、狼烟、镜子、磁石(前-量子纠缠)……
* 烽火——有/无火光 ➡️ 有事/无事——二元比特交流——信号
* 非洲鼓点——鼓声音调编码信息传播的语言符号系统——从信号到对话
➡️ “电子鼓点”——摩斯密码——点-划字母表,通过电子脉冲的停顿与开闭
### 会说话的鼓——冗余-抗噪;灯塔传讯——简化信息-压缩
**如何编码?**
## 2 口语&书写
**持久的文字——心智中并无词典**
书写文字作为一种技术,知识的抽离与储存(“不在场者的话语”p51),是内容也是媒介——>导向 系统化知识

每一次技术/信息生产-传播的更新都带来了权力的短暂集中(eg. 鼓声的编码与大众媒介的传播者,技术接触性以及学习并熟练使用规则的能力)……而信息技术的黑客们得以快速翻转这一局面!
互联网文化的核心——口语文化复兴
**数字的书写** p51
“此即为解法”——算法

🆚 词典——a-z26个字母的排序,中文词典的排序
## 3 书写文字及词典
**两本词典——我们文字的不确定性以及我们拼写的随意性**
语言(系统规范)—— 言语(简化信息-压缩)——信息容许噪音
语言口语与书写文字交接时,文字拼写形式与意义具有不确定性与随意性;在字母顺序的基础上建立规范化的文字系统。
➡️ **词典**
**最早的字母排序!** p62 BC250,亚历山大港莎草纸,字母排序藏书,约定俗成的a-z26个字母表;非自然的、去意义的规范;词到物(p62 中国《尔雅》,从物到词)
* 16世纪,考德理,《字母排表》(日用难词的释义)
* 1933,《牛津英语词典》
*第三版开始在线修订,没有实体版本——互联网出现后语言与知识加速变动 🔗 wikipedia
——词典,横向作为语言的网络系统,纵向是语言的历史考古
(人类公共知识档案)
### 时效、真实可靠与系统全面之间的矛盾
**Q:如何教学一个从未使用过词典的人使用词典?(词典的逻辑是怎样的?)**
26个字母顺序与单词首位次序的嵌套检索方法(?)
**Q:什么词可以进入词典?如何判定正误?谁有权力判断?词典如何成为权威、仲裁与示范?**(释义)
(牛津英语词典)普遍使用并存活五年以上;
词汇作为共同经验的量度、作为互相连通的符号系统。
**Q:词典是否可能完备?**
“网络无限宽广“、“英语之圆有清晰明确的中心,但没有可以辨识的圆周”
文字,不方便计算,共同经验的量度、意义的阐释
## 4 机械计算——差分机
**将思想的力量注入齿轮机械——喔,欣喜若狂的算术家啊!**
18世纪,**机械**的时代(一工,蒸汽机)
(牛顿的微积分成为了权威与数学进步的阻碍)
1791,**巴贝奇**(和助手爱达)
**生产数(而非物质商品)的机器**,连结实体物质世界和纯粹抽象世界——不耗费原材料、输入输出无重量的生产
➡️ 批量地、重复地生产数——数表(需要足够信息)
**机械和数的运算**相结合——机器计算
**差分机**(机械与思想的结合),自动化算盘,通用语言——差分表:通过差分来降阶,差分机反向运算

机器从处理数到**信息**(符号、意义)、更抽象的东西(爱达)
为问题寻求形式化解法——早期的编程算法
## 5 通讯电网
**地球的神经系统——就那么几根破电线,我们能指望它什么呢?**
**二工,电**
**电报**
信息的编码(保密+经济)& 传输(速度+准确)
**电-语言的转换** 模拟信号——通讯表现形式:电报、电话
➡️ 地球成为大脑,电网作为神经网络
**Q:如何进行远距离通讯?**
(从蒸汽机械到不可见的抽象电)
从信号塔(空中书写,信息更为复杂的烽火台——简化;p128操作员不识字,信息去意义)到电路——**摩斯密码**的简化编码——运用信号系统编码信息,**通断电二元编码**(技术为媒介即信息)
1844年,用户界面——弹簧杠杆作为通断电的开关——最早的“键”
——公众皆可使用、什么信息都可以传输的网络;“现在”的消息
➡️ 在摩斯密码之上的密码(二次编码,为了保密或更便宜)+密码本,压缩后的个性化信息形式(缩写词雏形yyds,以及为什么现在大家的废话这么多)
eg. 新闻、金融界的时空机/“预言”、抓犯罪分子、天气预报
**如何理解信息?** 非实物…………区分信息与承载信息的媒介(趣事:发送信息,被挂在了钩子上;发送泡菜到战争前线)
从抽象到另一种抽象(的编码)——
1⃣️ 摩斯密码——将日常语言转化为适用于铜线实时传播的语言,点-划
2⃣️ 布尔逻辑编码——加入数学演算,“0/1”作为占位符&运算符(后来的计算机语言)
🔗 当代:404审查之下的密码编译,airdrop/加密交易;英文、古文、世界语、非主流文字(吹哨)
*编码的规范化导致语言的死板与约束
## 6 电气时代
**新电线,新逻辑——没有别的什么东西比它更严密地为未知所包裹**
20世纪 电气时代
铁丝网电报(铁丝网作为隔阂最终成为节点连接的工具)
**电报、电话、无线电广播——通讯设备**
布什,微分分析机
香农——电与逻辑、符号
测量电量,控制电磁波——调制其幅度和频率
电话网络的组织问题,包括电话交换、电话编号,以及网络逻辑等——电话簿(电话号码——每个人拥有一个特定编号——居然是这个时候才有的???🔗 网络IP地址),接线员
(电报的信息为散点状,而电话传递的信息是连续的-承载频率的带宽)
### 万物化身为电——电——符号-文字/图像/影音
## 7 信息论
**信息论——我想要的不过是一颗寻常的大脑**
**香农**
战争时期加密通讯的需要——密码学:语言学——>数学(计算)
*符号学——语言意义的加密?
*密码学——>加密无政府主义(数学的政治化——个人隐私与自我负责);加密货币(去中心化数字金融);加密艺术(NFT,艺术交易方式)
密码系统 🆚 有噪通讯系统——冗余度辅助日常理解,是密码分析的阿克琉斯之踵
信息是一种出乎意料,是熵(无序程度),信息消除不确定性,信息论去除意义进行分析
单位:binary digit(二进制 01)——>bit
《通信的数学理论》
通信——在一点精确或近似地复现另一点所选取的讯息
通讯五要素——

随机概率——一条讯息其未来走向受到过去的影响(eg. 在英文结构中t之后跟h的概率较大)
高阶近似 *输入法?人工智能?
**图灵**
破解德军通信密码(enigma),图灵测试(计算机会思考吗?)*计算机(计算的机器)——>电脑(由电支撑运行的模拟人脑)
图灵机——纸带、符号与状态(计算机的早期想象),通用(universal)
## 8 控制论
**信息转向——形成心智的基本要素**
**维纳**
控制论(cybernetics *源自希腊语“舵手”):关于人、动物和机器如何相互控制和通信的科学研究——>赛博格(Cyborg):人-机
伺服系统(server):具有内在目的性行动——控制与自我调节
引入(电气工程)反馈——

*回归人类中心的思考 eg. 精神失调、机械假肢、机器智能引起社会失序等等
## 9 熵
**熵及其妖——你无法通过搅拌将果酱和布丁区分开来**
1865年,克劳修斯,提出“熵”(热力学)
熵(entropy),希腊语“转移”——
热力学:能量的不可用程度 *做功转移能量但总数不变——宇宙尺度-热寂[汤姆森],能量耗散——无序[麦克斯韦] *麦克斯韦妖,抵抗无序、扭转不可逆的小妖怪——如何?信息、生命……
信息:信息的不确定程度(信息基于物质转移 *通讯)
生命:生物的活动 eg. 整理房间,控制并降低熵、从无序走向有序,生命的物理学阐释[薛定谔]
## 10 基因
**生命的编码——关于生物体的完整描述都已写在了卵里**
基因是一种信息[道金斯]
生物、能量流——>信息流——信息学用语进入生物化学
DNA,信息储存与转换——编码规范,四进制的密码排布(生物化学的数学化、精确化——分子生物学);无效基因片段——以冗杂抵抗复制中的噪音,容错
道金斯:超越单个分子-DNA思考,群体进化、声成副本并永生
## 11 模因(meme)
**跃入模因池——它其实就是寄生在了我的大脑里**
从生物-基因到文化-模因
寄宿于人脑、如病毒般传播的文化模因(meme)
*模——模式、模仿
谁控制谁?在伪造作者即“人之死”后(eg. 不知源头的网络流行语、伪造的名人名言),所有权被消解,病毒将宿主彻底杀死,创造共产假象
传播?连锁信(eg. 以威胁式言语逼迫转发给身边的好友)
变异?
## 12 随机性
**认识随机性——僭越之罪**
哥德尔——不完全性定理
蔡廷——香农信息论+图灵“不可计算性”
科尔莫哥洛夫——概率论公理化(度量给定有限对象所含信息量——组合、概率、算法)
所罗门诺夫——归纳推理
——最短程序长度
概率
不可计算性
随机性=信息=复杂度
或然性——尚未掌握的规律
无知是主观的,(如果存在)随机性是事物本身的性质
举例:
01010101010101010101010101
0101000010110101001001010
两串数字发生的概率相同(若在发生之前做预测),现在我们面对的是已生成数字串,做一分析理解:由于1号数字串具有规律性(即模式),因此可被计算编程(信息可被压缩),而2号没有规律——因此2号的随机性比1号大,即信息量更大。因此信息量并非以可见量为衡量(eg. 重复说一句话,文字量很大、信息量很小,不考虑意义),而要以压缩后的信息量为比较。
信息的价值量度:信息处理——逻辑深度(考虑意义)eg. 艺术、文学
*随机——公平——🔗 密钥,哈希值(?)
## 13 量子信息
**信息是物理的——万物源自比特**
## 14 人类公共知识,维基百科(信息过载)
**洪流过后——一本宏大的巴别相册**
**Q:人类如何穷尽知识?**
图书馆——>维基百科——消解权威到成为没有作者姓名的集体权威
wiki编写者分类:删除主义 🆚 收录主义——**什么能成为人类的公共知识?** 筛选、整理——价值衡量?
重名——>域名的圈地运动(身份、地址)
信息量级:比特——>字节,云
## 15 被看见的信息,搜索引擎(信息过载)
**每天都有新消息——或者诸如此类**
信息过载——全噪音
记忆与失忆——遗忘权
信息储存——展示(注意力)——被看见(搜索/被筛选)
网络连通,集体知识
## 16 从信息到意义网络
尾声——意义的回归