
分享一个中文文案排版纠正器,原发于 https://laravel-china.org/articles/4532/chinese-copywriter
项目地址 https://github.com/ricoa/copywriting-correct
演示地址 https://copywriting-correct.ricoo.top
统一中文文案、排版的相关用法,降低团队成员之间的沟通成本,增强网站气质。
比较以下排版:
LeanCloud 数据存储是围绕 AVObject 进行的.每个 AVObject 都包含了与 JSON 兼容的 key-value 对应的数据。数据是 schema-free 的,你不需要在每个 AVObject 上提前指定存在哪些键,只要直接设定对应的 key-value 即可。 gitHub 是一个通过 git 进行版本控制的软件源代码托管服务,由 GitHub 公司(曾称 Logical Awesome )的开发者 Chris Wanstrath 、 PJ Hyett 和 Tom Preston-Werner 使用 Ruby on Rails 编写而成。
LeanCloud 数据存储是围绕 AVObject 进行的。每个 AVObject 都包含了与 JSON 兼容的 key-value 对应的数据。数据是 schema-free 的,你不需要在每个 AVObject 上提前指定存在哪些键,只要直接设定对应的 key-value 即可。 GitHub 是一个通过 Git 进行版本控制的软件源代码托管服务,由 GitHub 公司(曾称 Logical Awesome )的开发者 Chris Wanstrath 、 PJ Hyett 和 Tom Preston-Werner 使用 Ruby on Rails 编写而成。
很明显,第二种排版中英文有空格,标点符号也使用正确,专有名词使用正确,会让人看起来更舒服,也更专业。 本系统正是基于 中文文案排版指北(简体中文版) 进行纠正,帮助解决中英文混排的排版问题,提高文案可阅读性。
//安装开发中版本 composer require ricoa/copywriting-correct:dev-master <?php require_once 'vendor/autoload.php'; use Ricoa\CopyWritingCorrect\CopyWritingCorrectService; $service=new CopyWritingCorrectService(); $text=$service->correct('在 LeanCloud 上,数据存储是围绕 AVObject 进行的。'); 继承 \Ricoa\CopyWritingCorrect\Correctors\Corrector ,并实现 handle 方法。例如 ExampleCorrector.php
<?php class ExampleCorrector extends \Ricoa\CopyWritingCorrect\Correctors\Corrector { protected static $corrector=null; /** * @param string $text * * @return mixed */ public function handle($text) { return $text; } } 使用:
<?php require_once 'vendor/autoload.php'; use Ricoa\CopyWritingCorrect\CopyWritingCorrectService; $service=new CopyWritingCorrectService(); $service->addCorrectors([ExampleCorrector::class]);//注入纠正器 $service->resetCorrectors([ExampleCorrector::class]);//重置纠正器,也即废弃默认的纠正器 $text=$service->correct('在 LeanCloud 上,数据存储是围绕 AVObject 进行的。'); [ '0' , '1' , '2' , '3' , '4' , '5' , '6' , '7' , '8' , '9' , 'A' , 'B' , 'C' , 'D' , 'E' , 'F' , 'G' , 'H' , 'I' , 'J' , 'K' , 'L' , 'M' , 'N' , 'O' , 'P' , 'Q' , 'R' , 'S' , 'T' , 'U' , 'V' , 'W' , 'X' , 'Y' , 'Z' , 'a' , 'b' , 'c' , 'd' , 'e' , 'f' , 'g' , 'h' , 'i' , 'j' , 'k' , 'l' , 'm' , 'n' , 'o' , 'p' , 'q' , 'r' , 's' , 't' , 'u' , 'v' , 'w' , 'x' , 'y' , 'z' , '-' , ' ' , '/' , '%' , '#' , '@' , '&' , '<' , '>' , '[' , ']' , '{' , '}' , '\' , '|' , '+' , '=' , '_' , '^' , ' ̄' , '`' ]; //转 [ '0', '1', '2', '3', '4', '5', '6', '7', '8', '9', 'A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J', 'K', 'L', 'M', 'N', 'O', 'P', 'Q', 'R', 'S', 'T', 'U', 'V', 'W', 'X', 'Y', 'Z', 'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l', 'm', 'n', 'o', 'p', 'q', 'r', 's', 't', 'u', 'v', 'w', 'x', 'y', 'z', '-', ' ', '/', '%', '#', '@', '&', '<', '>', '[', ']', '{', '}', '\\','|', '+', '=', '_', '^', '~', '`' ]; 有什么新的想法和建议,欢迎提交 issue 或者 Pull Requests。
基于 MIT license.
1 neroxps 2017-04-26 16:47:31 +08:00 bug 反馈,括号后面的英文标点不会纠正成中文符号。 例如:(你好). 应该纠正成 (你好)。 另建议 ( abc ) 能够纠正成 (abc) 意思就是如果括号内容是中文,就用中文括号,如果是英文,就应该用英文括号。 小建议 XD |
2 geelaw 2017-04-26 16:49:46 +08:00 这个指北本身问题也很多,此外这个实现也有很多问题。 “在合适的位置添加空格”并不是正确的排版方式,而是一种因为现代浏览器不能正确排版而做的 hack 。那些位置应该具有的是 *空白* 而不是空格。如果你使用 Word 或 Outlook 就不会有这个问题。 另外看起来本文提到的 example 并不是最新的纠正器的结果:比如“。”和“ GitHub ”之间不需要空格,“ Awesome ”和“)”之间也不需要,“ Wanstrath ”、“、”和“ PJ ”之间也不需要。但是目前网页演示得到的结果是正确的。 汉字和拉丁字母之间插入空格的实现是错误的,例如“法语中两人初次见面可以用nchanté(e)打招呼。”中第一个空格并未被加入。 数字和拉丁字母之间增加空格也不一定是正确的,例如 1Password 。 纠正拼写太激进,譬如 ruby 变 Ruby 和 window(s) 变 Windows 都不一定是正确的,还有 chef 、 grape 、 office 、 underscore 等词语也不应该自动纠正。以下词语是正确拼写: Vim 、 git (它可以是命令的名字)。 把 ie 替换为可能是错误的,它还可能是 i.e.。 拼写纠正器可能会意外地把 git-scm.org 纠正为非 canonical 的写法 Git-scm.org 。 另外双写、三连写“!”或“?”是正确用法。 |
3 byron 2017-04-26 17:13:27 +08:00 很好的产品,我本来想撸一个来着。 不过恕我眼拙,排版 1 和排版 2 我只看到了几个专有名词的区别, git-->Git 、 github-->GitHub 等。 |
4 byron 2017-04-26 17:16:50 +08:00 另外,建议把一些有争议的地方做成可选项。 比如最上面有开关,询问用户是习惯使用「直角引号」还是“弯引号”。 |
6 geelaw 2017-04-26 17:36:47 +08:00 via iPhone @ynyounuo 我在其他帖子吐槽过这个智障设定,尤其是它的修正算法错得离谱。我个人也会使用空格代替空白的 hack ,而且很少写错 |
7 momocraft 2017-04-26 17:40:03 +08:00 很棒 我也在考虑做类似的东西 (不过不是 PHP),可能会模仿这个的一些功能。 |
9 vazo 2019-03-23 10:17:13 +08:00 楼主,你的演示网站已打不开 https://copywriting-correct.ricoo.top |