先加一个列表。部分内容待合并。 - [ ] 体例 - [ ] 内容结构 - [ ] 优化内容划分 - [ ] 新建页面? - [ ] 如何链接[现有页面](https://github.com/FrankHB/pl-docs/blob/master/zh-CN/string-and-string-length.md)? - [ ] 进度计划 - [x] 感兴趣的优先重点?(iAsiby:[先讲一讲基本概念](https://github.com/FrankHB/pl-docs/issues/6#issuecomment-491193399)。) - [ ] 更新依赖的基础知识 - [ ] [基本介绍](https://gist.github.com/FrankHB/6319030) - [ ] 保留提纲 - [ ] 基本概念:字符、字符串、字符集、字符编码、文本…… - [ ] 补充其它概要内容 - [ ] 拆分内容到以下列表 - [ ] 相关接口设计 - [ ] 数学模型 - [ ] 字符集合/字母表 - [ ] 串 - [x] 基准形式定义[参考](https://mathworld.wolfram.com/String.html) - [ ] 串和字符列表 - [ ] 形式语言和文本处理中的差异 - [ ] 语言提供的接口 - [ ] 字符和纯量类型 - [ ] 编码字符和整数类型 - [ ] 向量和字符串 - [ ] 优化实现 - [ ] 只读对象 - [ ] 池(pool) - [ ] 对象驻留(intern) - [ ] 二进制映像的只读数据节 - [ ] 语言运行时中的只读压缩存储 - [ ] 写时复制(COW, copy-on-write) - [ ] 小字符串优化(SSO, small string optimization) - [ ] 体系结构相关优化:字符串操作 - [ ] 历史遗留问题和现状 - [ ] “字符”类型的语义问题 - [ ] 字符和字节(byte) - [x] [面向文本](https://github.com/FrankHB/pl-docs/blob/master/zh-CN/about-operating-systems.md#%E9%9D%A2%E5%90%91%E6%96%87%E6%9C%ACtext-oriented)引起的问题 - [ ] 本地化问题 - [ ] 接口实现的二进制兼容性问题 - [ ] 其它特定用途的高层实现方式 - [ ] 非编辑用途的只读数据结构(阅读器和浏览器) - [ ] 优化搜索的数据结构和算法 - [ ] 纯文本编辑器 - [ ] 富文本编辑器 - [ ] 结构化编辑器 - [ ] 源代码编辑器 - [ ] [一些数据结构参考](https://ice1000.org/2018/09/24/CodeEditor4/) - [ ] 选型问题 - [ ] 一般建议 - [ ] 明确用途 - [x] 区分外部编码和内部编码(参见以下关于 UTF-8 的讨论) - [ ] Unicode - [ ] 设计缺陷 - [x] [关于 UTF-8](https://github.com/FrankHB/pl-docs/blob/master/zh-CN/criticisms-on-UTF-8-everywhere-manifesto.md) ([src](https://gist.github.com/FrankHB/00731fedf07b4ea271afa70a5cdc8d9d#utf-8-everywhere-manifesto), [fixed](https://github.com/FrankHB/pl-docs/commit/2abe05a3109af1deb5104d65476d8f83dbb0b5e8))
先加一个列表。部分内容待合并。