在Excel中,使用正则表达式`[一-龟]`可以代表所有汉字。具体原因如下:
Unicode编码范围 简体汉字的Unicode编码范围为 19968~40869
,包含约2.1万个汉字。公式中使用的`龟`字符(Unicode 40863)是该范围内最常用的汉字之一,而`龥`(Unicode 40869)因罕见性未被采用。
Excel的简化设计
由于`龥`字不常用且输入困难,Excel选择用`龟`作为代表,形成`[一-龟]`的便捷表达式,既能覆盖所有汉字,又兼顾实用性。
函数应用示例
在Excel中,可通过`=REGEXP(A2,"[一-龟]")`提取单元格A2内的所有汉字,省略了正则表达式的第三参数(默认为提取功能)。
总结:
Excel通过`[一-龟]`这一简化的正则表达式,巧妙地利用了汉字的Unicode编码范围,实现了对所有汉字的提取功能。