947 views
# 信息简史 惠勒——it form bit **万物源于比特,万物皆算法** / 霍布斯,**数**比火更重要(普罗米修斯给予人类最珍贵的礼物或许不是火、而是排列字母的技术——字母表是信息技术中的奠基) / **信息论**(不确定性-熵 与 随机性)与**控制论**(反馈) / **计算**(差分机)——**编码**(词典)——**通讯**(鼓与烽火、口语与文字、电网与互联网)——**储存**(物理到数字档案) / 生命的核心是信息、字词和指令——生命&机器(有机体的去魅) 生物**基因**——>**迷因**(meme)——文化的基因(道金斯《自私的基因》) / **信息过载**与**意义网络** ## 引言 **Q:什么是信息?** 电话(有线-电)、无线电广播、电视信号……传输的是什么?用什么单位进行计数? 如何打包&压缩信号,更快传输? 电子与电信产业重要节点—— **硬件**——1948年,贝尔电话实验室——**晶体管(transistor)**——电子技术微型化与普遍应用(固体半导体,以电信号控制开关、调制信号等等,类比大脑神经元细胞) ![](https://upload-images.jianshu.io/upload_images/30022-2dbc4e646c5bddb2.jpg?imageMogr2/auto-orient/strip|imageView2/2/w/1063/format/webp) **基础**——贝尔实验室数学研究组的香农——《通信的数学理论》——**测量信息的单位:比特**——逻辑与电的结合——信息论 信息对各个学科的渗透——数学+电气工程、计算机科学、生物遗传学(DNA编译)、货币金融(全区网络比特币)、物理-量子物理(或许信息是世界的本质!比物质存在更加基本,比特才是不能再分的核心——宇宙或许是一台巨大的信息处理器) ## 1 古老的信息编码与传递 **会说话的鼓——似是而非的编码** 古老的信息传递方式——物理编码,快速跨越空间传播 eg. 旗帜、号角、狼烟、镜子、磁石(前-量子纠缠)…… * 烽火——有/无火光 ➡️ 有事/无事——二元比特交流——信号 * 非洲鼓点——鼓声音调编码信息传播的语言符号系统——从信号到对话 ➡️ “电子鼓点”——摩斯密码——点-划字母表,通过电子脉冲的停顿与开闭 ### 会说话的鼓——冗余-抗噪;灯塔传讯——简化信息-压缩 **如何编码?** ## 2 口语&书写 **持久的文字——心智中并无词典** 书写文字作为一种技术,知识的抽离与储存(“不在场者的话语”p51),是内容也是媒介——>导向 系统化知识 ![](https://i.imgur.com/sZNoHAI.png) 每一次技术/信息生产-传播的更新都带来了权力的短暂集中(eg. 鼓声的编码与大众媒介的传播者,技术接触性以及学习并熟练使用规则的能力)……而信息技术的黑客们得以快速翻转这一局面! 互联网文化的核心——口语文化复兴 **数字的书写** p51 “此即为解法”——算法 ![](https://i.imgur.com/TPcEc9r.png) 🆚 词典——a-z26个字母的排序,中文词典的排序 ## 3 书写文字及词典 **两本词典——我们文字的不确定性以及我们拼写的随意性** 语言(系统规范)—— 言语(简化信息-压缩)——信息容许噪音 语言口语与书写文字交接时,文字拼写形式与意义具有不确定性与随意性;在字母顺序的基础上建立规范化的文字系统。 ➡️ **词典** **最早的字母排序!** p62 BC250,亚历山大港莎草纸,字母排序藏书,约定俗成的a-z26个字母表;非自然的、去意义的规范;词到物(p62 中国《尔雅》,从物到词) * 16世纪,考德理,《字母排表》(日用难词的释义) * 1933,《牛津英语词典》 *第三版开始在线修订,没有实体版本——互联网出现后语言与知识加速变动 🔗 wikipedia ——词典,横向作为语言的网络系统,纵向是语言的历史考古 (人类公共知识档案) ### 时效、真实可靠与系统全面之间的矛盾 **Q:如何教学一个从未使用过词典的人使用词典?(词典的逻辑是怎样的?)** 26个字母顺序与单词首位次序的嵌套检索方法(?) **Q:什么词可以进入词典?如何判定正误?谁有权力判断?词典如何成为权威、仲裁与示范?**(释义) (牛津英语词典)普遍使用并存活五年以上; 词汇作为共同经验的量度、作为互相连通的符号系统。 **Q:词典是否可能完备?** “网络无限宽广“、“英语之圆有清晰明确的中心,但没有可以辨识的圆周” 文字,不方便计算,共同经验的量度、意义的阐释 ## 4 机械计算——差分机 **将思想的力量注入齿轮机械——喔,欣喜若狂的算术家啊!** 18世纪,**机械**的时代(一工,蒸汽机) (牛顿的微积分成为了权威与数学进步的阻碍) 1791,**巴贝奇**(和助手爱达) **生产数(而非物质商品)的机器**,连结实体物质世界和纯粹抽象世界——不耗费原材料、输入输出无重量的生产 ➡️ 批量地、重复地生产数——数表(需要足够信息) **机械和数的运算**相结合——机器计算 **差分机**(机械与思想的结合),自动化算盘,通用语言——差分表:通过差分来降阶,差分机反向运算 ![](https://s9.rr.itc.cn/r/wapChange/20172_7_9/a68flp531680541912.jpg) 机器从处理数到**信息**(符号、意义)、更抽象的东西(爱达) 为问题寻求形式化解法——早期的编程算法 ## 5 通讯电网 **地球的神经系统——就那么几根破电线,我们能指望它什么呢?** **二工,电** **电报** 信息的编码(保密+经济)& 传输(速度+准确) **电-语言的转换** 模拟信号——通讯表现形式:电报、电话 ➡️ 地球成为大脑,电网作为神经网络 **Q:如何进行远距离通讯?** (从蒸汽机械到不可见的抽象电) 从信号塔(空中书写,信息更为复杂的烽火台——简化;p128操作员不识字,信息去意义)到电路——**摩斯密码**的简化编码——运用信号系统编码信息,**通断电二元编码**(技术为媒介即信息) 1844年,用户界面——弹簧杠杆作为通断电的开关——最早的“键” ——公众皆可使用、什么信息都可以传输的网络;“现在”的消息 ➡️ 在摩斯密码之上的密码(二次编码,为了保密或更便宜)+密码本,压缩后的个性化信息形式(缩写词雏形yyds,以及为什么现在大家的废话这么多) eg. 新闻、金融界的时空机/“预言”、抓犯罪分子、天气预报 **如何理解信息?** 非实物…………区分信息与承载信息的媒介(趣事:发送信息,被挂在了钩子上;发送泡菜到战争前线) 从抽象到另一种抽象(的编码)—— 1⃣️ 摩斯密码——将日常语言转化为适用于铜线实时传播的语言,点-划 2⃣️ 布尔逻辑编码——加入数学演算,“0/1”作为占位符&运算符(后来的计算机语言) 🔗 当代:404审查之下的密码编译,airdrop/加密交易;英文、古文、世界语、非主流文字(吹哨) *编码的规范化导致语言的死板与约束 ## 6 电气时代 **新电线,新逻辑——没有别的什么东西比它更严密地为未知所包裹** 20世纪 电气时代 铁丝网电报(铁丝网作为隔阂最终成为节点连接的工具) **电报、电话、无线电广播——通讯设备** 布什,微分分析机 香农——电与逻辑、符号 测量电量,控制电磁波——调制其幅度和频率 电话网络的组织问题,包括电话交换、电话编号,以及网络逻辑等——电话簿(电话号码——每个人拥有一个特定编号——居然是这个时候才有的???🔗 网络IP地址),接线员 (电报的信息为散点状,而电话传递的信息是连续的-承载频率的带宽) ### 万物化身为电——电——符号-文字/图像/影音 ## 7 信息论 **信息论——我想要的不过是一颗寻常的大脑** **香农** 战争时期加密通讯的需要——密码学:语言学——>数学(计算) *符号学——语言意义的加密? *密码学——>加密无政府主义(数学的政治化——个人隐私与自我负责);加密货币(去中心化数字金融);加密艺术(NFT,艺术交易方式) 密码系统 🆚 有噪通讯系统——冗余度辅助日常理解,是密码分析的阿克琉斯之踵 信息是一种出乎意料,是熵(无序程度),信息消除不确定性,信息论去除意义进行分析 单位:binary digit(二进制 01)——>bit 《通信的数学理论》 通信——在一点精确或近似地复现另一点所选取的讯息 通讯五要素—— ![](https://i.imgur.com/KrQ13yc.png) 随机概率——一条讯息其未来走向受到过去的影响(eg. 在英文结构中t之后跟h的概率较大) 高阶近似 *输入法?人工智能? **图灵** 破解德军通信密码(enigma),图灵测试(计算机会思考吗?)*计算机(计算的机器)——>电脑(由电支撑运行的模拟人脑) 图灵机——纸带、符号与状态(计算机的早期想象),通用(universal) ## 8 控制论 **信息转向——形成心智的基本要素** **维纳** 控制论(cybernetics *源自希腊语“舵手”):关于人、动物和机器如何相互控制和通信的科学研究——>赛博格(Cyborg):人-机 伺服系统(server):具有内在目的性行动——控制与自我调节 引入(电气工程)反馈—— ![](https://i.imgur.com/MLap2gj.png) *回归人类中心的思考 eg. 精神失调、机械假肢、机器智能引起社会失序等等 ## 9 熵 **熵及其妖——你无法通过搅拌将果酱和布丁区分开来** 1865年,克劳修斯,提出“熵”(热力学) 熵(entropy),希腊语“转移”—— 热力学:能量的不可用程度 *做功转移能量但总数不变——宇宙尺度-热寂[汤姆森],能量耗散——无序[麦克斯韦] *麦克斯韦妖,抵抗无序、扭转不可逆的小妖怪——如何?信息、生命…… 信息:信息的不确定程度(信息基于物质转移 *通讯) 生命:生物的活动 eg. 整理房间,控制并降低熵、从无序走向有序,生命的物理学阐释[薛定谔] ## 10 基因 **生命的编码——关于生物体的完整描述都已写在了卵里** 基因是一种信息[道金斯] 生物、能量流——>信息流——信息学用语进入生物化学 DNA,信息储存与转换——编码规范,四进制的密码排布(生物化学的数学化、精确化——分子生物学);无效基因片段——以冗杂抵抗复制中的噪音,容错 道金斯:超越单个分子-DNA思考,群体进化、声成副本并永生 ## 11 模因(meme) **跃入模因池——它其实就是寄生在了我的大脑里** 从生物-基因到文化-模因 寄宿于人脑、如病毒般传播的文化模因(meme) *模——模式、模仿 谁控制谁?在伪造作者即“人之死”后(eg. 不知源头的网络流行语、伪造的名人名言),所有权被消解,病毒将宿主彻底杀死,创造共产假象 传播?连锁信(eg. 以威胁式言语逼迫转发给身边的好友) 变异? ## 12 随机性 **认识随机性——僭越之罪** 哥德尔——不完全性定理 蔡廷——香农信息论+图灵“不可计算性” 科尔莫哥洛夫——概率论公理化(度量给定有限对象所含信息量——组合、概率、算法) 所罗门诺夫——归纳推理 ——最短程序长度 概率 不可计算性 随机性=信息=复杂度 或然性——尚未掌握的规律 无知是主观的,(如果存在)随机性是事物本身的性质 举例: 01010101010101010101010101 0101000010110101001001010 两串数字发生的概率相同(若在发生之前做预测),现在我们面对的是已生成数字串,做一分析理解:由于1号数字串具有规律性(即模式),因此可被计算编程(信息可被压缩),而2号没有规律——因此2号的随机性比1号大,即信息量更大。因此信息量并非以可见量为衡量(eg. 重复说一句话,文字量很大、信息量很小,不考虑意义),而要以压缩后的信息量为比较。 信息的价值量度:信息处理——逻辑深度(考虑意义)eg. 艺术、文学 *随机——公平——🔗 密钥,哈希值(?) ## 13 量子信息 **信息是物理的——万物源自比特** ## 14 人类公共知识,维基百科(信息过载) **洪流过后——一本宏大的巴别相册** **Q:人类如何穷尽知识?** 图书馆——>维基百科——消解权威到成为没有作者姓名的集体权威 wiki编写者分类:删除主义 🆚 收录主义——**什么能成为人类的公共知识?** 筛选、整理——价值衡量? 重名——>域名的圈地运动(身份、地址) 信息量级:比特——>字节,云 ## 15 被看见的信息,搜索引擎(信息过载) **每天都有新消息——或者诸如此类** 信息过载——全噪音 记忆与失忆——遗忘权 信息储存——展示(注意力)——被看见(搜索/被筛选) 网络连通,集体知识 ## 16 从信息到意义网络 尾声——意义的回归