1 /* 2 * Copyright (C) 2013 The Android Open Source Project 3 * 4 * Licensed under the Apache License, Version 2.0 (the "License"); 5 * you may not use this file except in compliance with the License. 6 * You may obtain a copy of the License at 7 * 8 * http://www.apache.org/licenses/LICENSE-2.0 9 * 10 * Unless required by applicable law or agreed to in writing, software 11 * distributed under the License is distributed on an "AS IS" BASIS, 12 * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. 13 * See the License for the specific language governing permissions and 14 * limitations under the License. 15 */ 16 17 // The 512 most frequently occuring characters for the zhCN language in a sample of the Internet. 18 // Ordered by codepoint, comment shows character and ranking by frequency 19 const uint16_t frequent_zhCN[] = { 20 0x4E00, // 一, #2 21 0x4E07, // 万, #306 22 0x4E09, // 三, #138 23 0x4E0A, // 上, #16 24 0x4E0B, // 下, #25 25 0x4E0D, // 不, #7 26 0x4E0E, // 与, #133 27 0x4E13, // 专, #151 28 0x4E16, // 世, #346 29 0x4E1A, // 业, #39 30 0x4E1C, // 东, #197 31 0x4E24, // 两, #376 32 0x4E2A, // 个, #23 33 0x4E2D, // 中, #4 34 0x4E3A, // 为, #31 35 0x4E3B, // 主, #95 36 0x4E3E, // 举, #418 37 0x4E48, // 么, #93 38 0x4E4B, // 之, #131 39 0x4E50, // 乐, #130 40 0x4E5F, // 也, #145 41 0x4E66, // 书, #283 42 0x4E70, // 买, #483 43 0x4E86, // 了, #13 44 0x4E8B, // 事, #168 45 0x4E8C, // 二, #218 46 0x4E8E, // 于, #64 47 0x4E94, // 五, #430 48 0x4E9A, // 亚, #468 49 0x4E9B, // 些, #366 50 0x4EA4, // 交, #243 51 0x4EA7, // 产, #86 52 0x4EAB, // 享, #345 53 0x4EAC, // 京, #206 54 0x4EBA, // 人, #3 55 0x4EC0, // 什, #287 56 0x4ECB, // 介, #478 57 0x4ECE, // 从, #381 58 0x4ED6, // 他, #129 59 0x4EE3, // 代, #241 60 0x4EE5, // 以, #51 61 0x4EEC, // 们, #83 62 0x4EF6, // 件, #141 63 0x4EF7, // 价, #140 64 0x4EFB, // 任, #383 65 0x4F01, // 企, #439 66 0x4F18, // 优, #374 67 0x4F1A, // 会, #29 68 0x4F20, // 传, #222 69 0x4F46, // 但, #451 70 0x4F4D, // 位, #208 71 0x4F53, // 体, #98 72 0x4F55, // 何, #339 73 0x4F5C, // 作, #44 74 0x4F60, // 你, #76 75 0x4F7F, // 使, #272 76 0x4F9B, // 供, #375 77 0x4FDD, // 保, #180 78 0x4FE1, // 信, #84 79 0x4FEE, // 修, #437 80 0x503C, // 值, #450 81 0x505A, // 做, #368 82 0x5065, // 健, #484 83 0x50CF, // 像, #487 84 0x513F, // 儿, #326 85 0x5143, // 元, #202 86 0x5148, // 先, #485 87 0x5149, // 光, #254 88 0x514B, // 克, #503 89 0x514D, // 免, #349 90 0x5165, // 入, #156 91 0x5168, // 全, #47 92 0x516C, // 公, #35 93 0x5171, // 共, #448 94 0x5173, // 关, #49 95 0x5176, // 其, #195 96 0x5177, // 具, #329 97 0x5185, // 内, #109 98 0x518C, // 册, #225 99 0x519B, // 军, #466 100 0x51FA, // 出, #53 101 0x51FB, // 击, #359 102 0x5206, // 分, #22 103 0x5217, // 列, #410 104 0x521B, // 创, #399 105 0x5229, // 利, #296 106 0x522B, // 别, #372 107 0x5230, // 到, #33 108 0x5236, // 制, #192 109 0x524D, // 前, #117 110 0x529B, // 力, #173 111 0x529E, // 办, #436 112 0x529F, // 功, #455 113 0x52A0, // 加, #97 114 0x52A1, // 务, #100 115 0x52A8, // 动, #46 116 0x52A9, // 助, #365 117 0x5305, // 包, #331 118 0x5316, // 化, #155 119 0x5317, // 北, #194 120 0x533A, // 区, #105 121 0x533B, // 医, #234 122 0x5341, // 十, #294 123 0x534E, // 华, #205 124 0x5355, // 单, #259 125 0x5357, // 南, #182 126 0x535A, // 博, #153 127 0x5361, // 卡, #332 128 0x539F, // 原, #271 129 0x53BB, // 去, #282 130 0x53C2, // 参, #500 131 0x53CA, // 及, #255 132 0x53CB, // 友, #186 133 0x53CD, // 反, #422 134 0x53D1, // 发, #15 135 0x53D7, // 受, #507 136 0x53D8, // 变, #395 137 0x53E3, // 口, #293 138 0x53EA, // 只, #340 139 0x53EF, // 可, #45 140 0x53F0, // 台, #267 141 0x53F7, // 号, #121 142 0x53F8, // 司, #150 143 0x5404, // 各, #491 144 0x5408, // 合, #115 145 0x540C, // 同, #189 146 0x540D, // 名, #127 147 0x540E, // 后, #75 148 0x5411, // 向, #459 149 0x5427, // 吧, #353 150 0x544A, // 告, #318 151 0x5458, // 员, #232 152 0x5468, // 周, #347 153 0x548C, // 和, #43 154 0x54C1, // 品, #36 155 0x5546, // 商, #148 156 0x5668, // 器, #228 157 0x56DB, // 四, #352 158 0x56DE, // 回, #38 159 0x56E0, // 因, #355 160 0x56E2, // 团, #412 161 0x56ED, // 园, #470 162 0x56FD, // 国, #12 163 0x56FE, // 图, #32 164 0x5728, // 在, #10 165 0x5730, // 地, #30 166 0x573A, // 场, #177 167 0x575B, // 坛, #364 168 0x578B, // 型, #274 169 0x57CE, // 城, #172 170 0x57FA, // 基, #315 171 0x58EB, // 士, #434 172 0x58F0, // 声, #397 173 0x5904, // 处, #416 174 0x5907, // 备, #270 175 0x590D, // 复, #122 176 0x5916, // 外, #190 177 0x591A, // 多, #40 178 0x5927, // 大, #8 179 0x5929, // 天, #52 180 0x592A, // 太, #456 181 0x5934, // 头, #258 182 0x5973, // 女, #65 183 0x597D, // 好, #62 184 0x5982, // 如, #135 185 0x5A31, // 娱, #452 186 0x5B50, // 子, #37 187 0x5B57, // 字, #285 188 0x5B66, // 学, #19 189 0x5B89, // 安, #144 190 0x5B8C, // 完, #469 191 0x5B9A, // 定, #179 192 0x5B9D, // 宝, #188 193 0x5B9E, // 实, #154 194 0x5BA2, // 客, #174 195 0x5BB6, // 家, #26 196 0x5BB9, // 容, #307 197 0x5BC6, // 密, #471 198 0x5BF9, // 对, #90 199 0x5BFC, // 导, #348 200 0x5C06, // 将, #265 201 0x5C0F, // 小, #28 202 0x5C11, // 少, #379 203 0x5C14, // 尔, #490 204 0x5C31, // 就, #101 205 0x5C55, // 展, #291 206 0x5C71, // 山, #239 207 0x5DDE, // 州, #227 208 0x5DE5, // 工, #73 209 0x5DF1, // 己, #480 210 0x5DF2, // 已, #310 211 0x5E02, // 市, #78 212 0x5E03, // 布, #350 213 0x5E08, // 师, #277 214 0x5E16, // 帖, #396 215 0x5E26, // 带, #449 216 0x5E2E, // 帮, #461 217 0x5E38, // 常, #319 218 0x5E73, // 平, #217 219 0x5E74, // 年, #20 220 0x5E76, // 并, #440 221 0x5E7F, // 广, #166 222 0x5E93, // 库, #446 223 0x5E94, // 应, #187 224 0x5E97, // 店, #320 225 0x5EA6, // 度, #114 226 0x5EB7, // 康, #499 227 0x5EFA, // 建, #211 228 0x5F00, // 开, #72 229 0x5F0F, // 式, #207 230 0x5F15, // 引, #495 231 0x5F20, // 张, #385 232 0x5F3A, // 强, #404 233 0x5F53, // 当, #233 234 0x5F55, // 录, #146 235 0x5F62, // 形, #494 236 0x5F69, // 彩, #356 237 0x5F71, // 影, #214 238 0x5F88, // 很, #300 239 0x5F97, // 得, #193 240 0x5FAE, // 微, #245 241 0x5FC3, // 心, #70 242 0x5FEB, // 快, #324 243 0x6001, // 态, #508 244 0x600E, // 怎, #370 245 0x6027, // 性, #99 246 0x603B, // 总, #398 247 0x606F, // 息, #176 248 0x60A8, // 您, #251 249 0x60C5, // 情, #87 250 0x60F3, // 想, #290 251 0x610F, // 意, #184 252 0x611F, // 感, #253 253 0x620F, // 戏, #237 254 0x6210, // 成, #71 255 0x6211, // 我, #11 256 0x6216, // 或, #321 257 0x6218, // 战, #369 258 0x6237, // 户, #215 259 0x623F, // 房, #236 260 0x6240, // 所, #147 261 0x624B, // 手, #55 262 0x624D, // 才, #407 263 0x6253, // 打, #281 264 0x6280, // 技, #203 265 0x6295, // 投, #408 266 0x62A4, // 护, #502 267 0x62A5, // 报, #113 268 0x62DB, // 招, #363 269 0x6301, // 持, #403 270 0x6307, // 指, #414 271 0x636E, // 据, #409 272 0x6392, // 排, #377 273 0x63A5, // 接, #266 274 0x63A8, // 推, #244 275 0x63D0, // 提, #181 276 0x641C, // 搜, #301 277 0x64AD, // 播, #401 278 0x652F, // 支, #400 279 0x6536, // 收, #158 280 0x653E, // 放, #317 281 0x653F, // 政, #380 282 0x6548, // 效, #496 283 0x6559, // 教, #170 284 0x6570, // 数, #136 285 0x6587, // 文, #21 286 0x6599, // 料, #295 287 0x65AF, // 斯, #473 288 0x65B0, // 新, #14 289 0x65B9, // 方, #68 290 0x65C5, // 旅, #457 291 0x65E0, // 无, #164 292 0x65E5, // 日, #50 293 0x65F6, // 时, #18 294 0x660E, // 明, #132 295 0x6613, // 易, #428 296 0x661F, // 星, #240 297 0x662F, // 是, #6 298 0x663E, // 显, #486 299 0x66F4, // 更, #103 300 0x6700, // 最, #61 301 0x6708, // 月, #80 302 0x6709, // 有, #5 303 0x670D, // 服, #94 304 0x671F, // 期, #139 305 0x672C, // 本, #56 306 0x672F, // 术, #216 307 0x673A, // 机, #27 308 0x6743, // 权, #250 309 0x6761, // 条, #309 310 0x6765, // 来, #42 311 0x677F, // 板, #505 312 0x6797, // 林, #475 313 0x679C, // 果, #212 314 0x67E5, // 查, #165 315 0x6807, // 标, #269 316 0x6821, // 校, #462 317 0x6837, // 样, #314 318 0x683C, // 格, #238 319 0x6848, // 案, #378 320 0x697C, // 楼, #342 321 0x6A21, // 模, #413 322 0x6B21, // 次, #263 323 0x6B22, // 欢, #443 324 0x6B3E, // 款, #358 325 0x6B63, // 正, #219 326 0x6B64, // 此, #362 327 0x6BD4, // 比, #298 328 0x6C11, // 民, #279 329 0x6C14, // 气, #303 330 0x6C34, // 水, #163 331 0x6C42, // 求, #373 332 0x6C5F, // 江, #336 333 0x6CA1, // 没, #229 334 0x6CBB, // 治, #425 335 0x6CD5, // 法, #85 336 0x6CE8, // 注, #119 337 0x6D3B, // 活, #231 338 0x6D41, // 流, #280 339 0x6D4B, // 测, #460 340 0x6D77, // 海, #124 341 0x6D88, // 消, #415 342 0x6DF1, // 深, #477 343 0x6E05, // 清, #311 344 0x6E38, // 游, #81 345 0x6E90, // 源, #325 346 0x706B, // 火, #498 347 0x70B9, // 点, #58 348 0x70ED, // 热, #183 349 0x7136, // 然, #308 350 0x7167, // 照, #431 351 0x7231, // 爱, #223 352 0x7247, // 片, #128 353 0x7248, // 版, #91 354 0x724C, // 牌, #429 355 0x7269, // 物, #169 356 0x7279, // 特, #224 357 0x738B, // 王, #351 358 0x73A9, // 玩, #476 359 0x73B0, // 现, #125 360 0x7403, // 球, #367 361 0x7406, // 理, #69 362 0x751F, // 生, #24 363 0x7528, // 用, #17 364 0x7531, // 由, #441 365 0x7535, // 电, #34 366 0x7537, // 男, #275 367 0x754C, // 界, #419 368 0x75C5, // 病, #371 369 0x767B, // 登, #204 370 0x767D, // 白, #338 371 0x767E, // 百, #157 372 0x7684, // 的, #1 373 0x76D8, // 盘, #493 374 0x76EE, // 目, #261 375 0x76F4, // 直, #391 376 0x76F8, // 相, #143 377 0x7701, // 省, #464 378 0x770B, // 看, #54 379 0x771F, // 真, #249 380 0x7740, // 着, #302 381 0x77E5, // 知, #142 382 0x7801, // 码, #257 383 0x7814, // 研, #387 384 0x793A, // 示, #334 385 0x793E, // 社, #343 386 0x795E, // 神, #330 387 0x798F, // 福, #509 388 0x79BB, // 离, #454 389 0x79CD, // 种, #278 390 0x79D1, // 科, #126 391 0x79EF, // 积, #390 392 0x7A0B, // 程, #209 393 0x7A76, // 究, #504 394 0x7A7A, // 空, #312 395 0x7ACB, // 立, #393 396 0x7AD9, // 站, #107 397 0x7AE0, // 章, #304 398 0x7B2C, // 第, #96 399 0x7B49, // 等, #210 400 0x7B54, // 答, #256 401 0x7B80, // 简, #474 402 0x7BA1, // 管, #221 403 0x7C7B, // 类, #246 404 0x7CBE, // 精, #226 405 0x7CFB, // 系, #89 406 0x7D22, // 索, #354 407 0x7EA2, // 红, #417 408 0x7EA7, // 级, #178 409 0x7EBF, // 线, #108 410 0x7EC4, // 组, #389 411 0x7EC6, // 细, #442 412 0x7ECF, // 经, #74 413 0x7ED3, // 结, #333 414 0x7ED9, // 给, #384 415 0x7EDC, // 络, #472 416 0x7EDF, // 统, #344 417 0x7F16, // 编, #424 418 0x7F51, // 网, #9 419 0x7F6E, // 置, #411 420 0x7F8E, // 美, #60 421 0x8001, // 老, #292 422 0x8003, // 考, #288 423 0x8005, // 者, #106 424 0x800C, // 而, #297 425 0x8054, // 联, #159 426 0x80B2, // 育, #327 427 0x80FD, // 能, #59 428 0x81EA, // 自, #77 429 0x8272, // 色, #198 430 0x8282, // 节, #361 431 0x82B1, // 花, #299 432 0x82F1, // 英, #316 433 0x8350, // 荐, #402 434 0x836F, // 药, #481 435 0x8425, // 营, #394 436 0x85CF, // 藏, #337 437 0x884C, // 行, #41 438 0x8868, // 表, #104 439 0x88AB, // 被, #289 440 0x88C5, // 装, #161 441 0x897F, // 西, #199 442 0x8981, // 要, #48 443 0x89C1, // 见, #360 444 0x89C2, // 观, #423 445 0x89C4, // 规, #453 446 0x89C6, // 视, #120 447 0x89E3, // 解, #264 448 0x8A00, // 言, #433 449 0x8BA1, // 计, #191 450 0x8BA4, // 认, #482 451 0x8BA9, // 让, #421 452 0x8BAE, // 议, #427 453 0x8BAF, // 讯, #388 454 0x8BB0, // 记, #273 455 0x8BBA, // 论, #66 456 0x8BBE, // 设, #162 457 0x8BC1, // 证, #201 458 0x8BC4, // 评, #111 459 0x8BC6, // 识, #463 460 0x8BD5, // 试, #323 461 0x8BDD, // 话, #247 462 0x8BE2, // 询, #432 463 0x8BE5, // 该, #447 464 0x8BE6, // 详, #497 465 0x8BED, // 语, #268 466 0x8BF4, // 说, #112 467 0x8BF7, // 请, #213 468 0x8BFB, // 读, #341 469 0x8C03, // 调, #438 470 0x8D22, // 财, #488 471 0x8D28, // 质, #386 472 0x8D2D, // 购, #260 473 0x8D34, // 贴, #510 474 0x8D39, // 费, #242 475 0x8D44, // 资, #116 476 0x8D77, // 起, #220 477 0x8D85, // 超, #406 478 0x8DEF, // 路, #235 479 0x8EAB, // 身, #262 480 0x8F66, // 车, #82 481 0x8F6C, // 转, #322 482 0x8F7D, // 载, #175 483 0x8FBE, // 达, #435 484 0x8FC7, // 过, #118 485 0x8FD0, // 运, #357 486 0x8FD1, // 近, #492 487 0x8FD8, // 还, #171 488 0x8FD9, // 这, #57 489 0x8FDB, // 进, #160 490 0x8FDE, // 连, #489 491 0x9009, // 选, #328 492 0x901A, // 通, #137 493 0x901F, // 速, #458 494 0x9020, // 造, #511 495 0x9053, // 道, #79 496 0x90A3, // 那, #305 497 0x90E8, // 部, #102 498 0x90FD, // 都, #167 499 0x914D, // 配, #479 500 0x9152, // 酒, #444 501 0x91CC, // 里, #196 502 0x91CD, // 重, #230 503 0x91CF, // 量, #248 504 0x91D1, // 金, #134 505 0x9500, // 销, #465 506 0x957F, // 长, #152 507 0x95E8, // 门, #185 508 0x95EE, // 问, #92 509 0x95F4, // 间, #88 510 0x95FB, // 闻, #313 511 0x9605, // 阅, #467 512 0x9633, // 阳, #420 513 0x9645, // 际, #501 514 0x9650, // 限, #286 515 0x9662, // 院, #276 516 0x96C6, // 集, #284 517 0x9700, // 需, #405 518 0x9762, // 面, #123 519 0x97F3, // 音, #335 520 0x9875, // 页, #63 521 0x9879, // 项, #506 522 0x9891, // 频, #200 523 0x9898, // 题, #110 524 0x98CE, // 风, #252 525 0x98DF, // 食, #445 526 0x9996, // 首, #149 527 0x9999, // 香, #512 528 0x9A6C, // 马, #392 529 0x9A8C, // 验, #382 530 0x9AD8, // 高, #67 531 0x9F99, // 龙, #426 532 }; 533 // the percentage of the sample covered by the above characters 534 static const float frequent_zhCN_coverage=0.718950369339973; 535 536 // The 512 most frequently occuring characters for the zhTW language in a sample of the Internet. 537 // Ordered by codepoint, comment shows character and ranking by frequency 538 const uint16_t frequent_zhTW[] = { 539 0x4E00, // 一, #2 540 0x4E09, // 三, #131 541 0x4E0A, // 上, #12 542 0x4E0B, // 下, #37 543 0x4E0D, // 不, #6 544 0x4E16, // 世, #312 545 0x4E26, // 並, #434 546 0x4E2D, // 中, #9 547 0x4E3B, // 主, #97 548 0x4E4B, // 之, #55 549 0x4E5F, // 也, #95 550 0x4E86, // 了, #19 551 0x4E8B, // 事, #128 552 0x4E8C, // 二, #187 553 0x4E94, // 五, #339 554 0x4E9B, // 些, #435 555 0x4E9E, // 亞, #432 556 0x4EA4, // 交, #264 557 0x4EAB, // 享, #160 558 0x4EBA, // 人, #3 559 0x4EC0, // 什, #483 560 0x4ECA, // 今, #380 561 0x4ECB, // 介, #468 562 0x4ED6, // 他, #65 563 0x4EE3, // 代, #284 564 0x4EE5, // 以, #26 565 0x4EF6, // 件, #234 566 0x4EFB, // 任, #381 567 0x4EFD, // 份, #447 568 0x4F46, // 但, #281 569 0x4F4D, // 位, #202 570 0x4F4F, // 住, #471 571 0x4F55, // 何, #334 572 0x4F5C, // 作, #56 573 0x4F60, // 你, #64 574 0x4F7F, // 使, #236 575 0x4F86, // 來, #38 576 0x4F9B, // 供, #397 577 0x4FBF, // 便, #440 578 0x4FC2, // 係, #506 579 0x4FDD, // 保, #161 580 0x4FE1, // 信, #268 581 0x4FEE, // 修, #473 582 0x500B, // 個, #27 583 0x5011, // 們, #109 584 0x505A, // 做, #383 585 0x5065, // 健, #415 586 0x5099, // 備, #461 587 0x50B3, // 傳, #277 588 0x50CF, // 像, #403 589 0x50F9, // 價, #93 590 0x512A, // 優, #396 591 0x5143, // 元, #158 592 0x5148, // 先, #382 593 0x5149, // 光, #216 594 0x514D, // 免, #321 595 0x5152, // 兒, #374 596 0x5165, // 入, #58 597 0x5167, // 內, #106 598 0x5168, // 全, #67 599 0x5169, // 兩, #322 600 0x516C, // 公, #53 601 0x516D, // 六, #493 602 0x5171, // 共, #456 603 0x5176, // 其, #148 604 0x5177, // 具, #328 605 0x518A, // 冊, #360 606 0x518D, // 再, #311 607 0x51FA, // 出, #44 608 0x5206, // 分, #15 609 0x5217, // 列, #259 610 0x5225, // 別, #361 611 0x5229, // 利, #251 612 0x5230, // 到, #29 613 0x5247, // 則, #511 614 0x524D, // 前, #82 615 0x5275, // 創, #409 616 0x529B, // 力, #176 617 0x529F, // 功, #430 618 0x52A0, // 加, #87 619 0x52A9, // 助, #465 620 0x52D5, // 動, #48 621 0x52D9, // 務, #102 622 0x5305, // 包, #248 623 0x5316, // 化, #223 624 0x5317, // 北, #145 625 0x5340, // 區, #60 626 0x5341, // 十, #242 627 0x5357, // 南, #261 628 0x535A, // 博, #484 629 0x5361, // 卡, #327 630 0x5370, // 印, #498 631 0x5373, // 即, #351 632 0x539F, // 原, #237 633 0x53BB, // 去, #190 634 0x53C3, // 參, #444 635 0x53C8, // 又, #426 636 0x53CA, // 及, #136 637 0x53CB, // 友, #142 638 0x53D6, // 取, #422 639 0x53D7, // 受, #410 640 0x53E3, // 口, #357 641 0x53EA, // 只, #250 642 0x53EF, // 可, #35 643 0x53F0, // 台, #34 644 0x53F8, // 司, #226 645 0x5403, // 吃, #362 646 0x5404, // 各, #454 647 0x5408, // 合, #147 648 0x540C, // 同, #173 649 0x540D, // 名, #108 650 0x544A, // 告, #186 651 0x548C, // 和, #130 652 0x54C1, // 品, #23 653 0x54E1, // 員, #150 654 0x5546, // 商, #75 655 0x554F, // 問, #120 656 0x559C, // 喜, #502 657 0x55AE, // 單, #210 658 0x55CE, // 嗎, #443 659 0x5668, // 器, #305 660 0x56DB, // 四, #318 661 0x56DE, // 回, #59 662 0x56E0, // 因, #253 663 0x570B, // 國, #21 664 0x5712, // 園, #345 665 0x5716, // 圖, #73 666 0x5718, // 團, #338 667 0x5728, // 在, #11 668 0x5730, // 地, #50 669 0x578B, // 型, #270 670 0x57CE, // 城, #466 671 0x57FA, // 基, #349 672 0x5831, // 報, #127 673 0x5834, // 場, #165 674 0x58EB, // 士, #372 675 0x5916, // 外, #152 676 0x591A, // 多, #54 677 0x5927, // 大, #8 678 0x5929, // 天, #43 679 0x592A, // 太, #343 680 0x5947, // 奇, #325 681 0x5973, // 女, #85 682 0x5979, // 她, #420 683 0x597D, // 好, #22 684 0x5982, // 如, #144 685 0x5B50, // 子, #46 686 0x5B57, // 字, #275 687 0x5B78, // 學, #49 688 0x5B89, // 安, #239 689 0x5B8C, // 完, #320 690 0x5B9A, // 定, #159 691 0x5BA2, // 客, #188 692 0x5BB6, // 家, #31 693 0x5BB9, // 容, #244 694 0x5BE6, // 實, #198 695 0x5BF6, // 寶, #367 696 0x5C07, // 將, #232 697 0x5C08, // 專, #133 698 0x5C0B, // 尋, #352 699 0x5C0D, // 對, #126 700 0x5C0E, // 導, #418 701 0x5C0F, // 小, #20 702 0x5C11, // 少, #368 703 0x5C31, // 就, #63 704 0x5C55, // 展, #341 705 0x5C71, // 山, #273 706 0x5DE5, // 工, #121 707 0x5DF1, // 己, #402 708 0x5DF2, // 已, #299 709 0x5E02, // 市, #81 710 0x5E2B, // 師, #262 711 0x5E36, // 帶, #470 712 0x5E38, // 常, #303 713 0x5E73, // 平, #297 714 0x5E74, // 年, #30 715 0x5E97, // 店, #171 716 0x5EA6, // 度, #220 717 0x5EB7, // 康, #441 718 0x5EE3, // 廣, #279 719 0x5EFA, // 建, #254 720 0x5F0F, // 式, #155 721 0x5F15, // 引, #346 722 0x5F35, // 張, #366 723 0x5F37, // 強, #437 724 0x5F71, // 影, #94 725 0x5F88, // 很, #177 726 0x5F8C, // 後, #66 727 0x5F97, // 得, #113 728 0x5F9E, // 從, #436 729 0x5FC3, // 心, #57 730 0x5FEB, // 快, #292 731 0x6027, // 性, #175 732 0x606F, // 息, #378 733 0x60A8, // 您, #252 734 0x60C5, // 情, #123 735 0x60F3, // 想, #178 736 0x610F, // 意, #168 737 0x611B, // 愛, #125 738 0x611F, // 感, #211 739 0x61C9, // 應, #164 740 0x6210, // 成, #86 741 0x6211, // 我, #7 742 0x6216, // 或, #199 743 0x6230, // 戰, #438 744 0x6232, // 戲, #309 745 0x6236, // 戶, #497 746 0x623F, // 房, #274 747 0x6240, // 所, #79 748 0x624B, // 手, #68 749 0x624D, // 才, #400 750 0x6253, // 打, #278 751 0x627E, // 找, #449 752 0x6280, // 技, #332 753 0x6295, // 投, #425 754 0x62C9, // 拉, #500 755 0x62CD, // 拍, #398 756 0x6307, // 指, #407 757 0x6392, // 排, #458 758 0x63A5, // 接, #326 759 0x63A8, // 推, #153 760 0x63D0, // 提, #235 761 0x641C, // 搜, #314 762 0x6469, // 摩, #472 763 0x6536, // 收, #249 764 0x6539, // 改, #508 765 0x653E, // 放, #331 766 0x653F, // 政, #295 767 0x6559, // 教, #184 768 0x6574, // 整, #394 769 0x6578, // 數, #134 770 0x6587, // 文, #16 771 0x6599, // 料, #167 772 0x65AF, // 斯, #476 773 0x65B0, // 新, #10 774 0x65B9, // 方, #96 775 0x65BC, // 於, #70 776 0x65C5, // 旅, #289 777 0x65E5, // 日, #18 778 0x660E, // 明, #118 779 0x6613, // 易, #482 780 0x661F, // 星, #205 781 0x662F, // 是, #5 782 0x6642, // 時, #13 783 0x66F4, // 更, #149 784 0x66F8, // 書, #209 785 0x6700, // 最, #51 786 0x6703, // 會, #14 787 0x6708, // 月, #25 788 0x6709, // 有, #4 789 0x670D, // 服, #99 790 0x671F, // 期, #139 791 0x672A, // 未, #404 792 0x672C, // 本, #45 793 0x6771, // 東, #221 794 0x677F, // 板, #364 795 0x6797, // 林, #330 796 0x679C, // 果, #179 797 0x67E5, // 查, #283 798 0x683C, // 格, #157 799 0x6848, // 案, #392 800 0x689D, // 條, #406 801 0x696D, // 業, #103 802 0x6A02, // 樂, #116 803 0x6A13, // 樓, #411 804 0x6A19, // 標, #384 805 0x6A23, // 樣, #306 806 0x6A5F, // 機, #40 807 0x6AA2, // 檢, #359 808 0x6B0A, // 權, #228 809 0x6B21, // 次, #227 810 0x6B3E, // 款, #276 811 0x6B4C, // 歌, #496 812 0x6B61, // 歡, #427 813 0x6B63, // 正, #206 814 0x6B64, // 此, #247 815 0x6BCF, // 每, #391 816 0x6BD4, // 比, #257 817 0x6C11, // 民, #230 818 0x6C23, // 氣, #200 819 0x6C34, // 水, #140 820 0x6C42, // 求, #501 821 0x6C92, // 沒, #162 822 0x6CD5, // 法, #89 823 0x6D3B, // 活, #124 824 0x6D41, // 流, #315 825 0x6D77, // 海, #258 826 0x6D88, // 消, #342 827 0x6E05, // 清, #329 828 0x6E2F, // 港, #293 829 0x6F14, // 演, #491 830 0x7063, // 灣, #195 831 0x70BA, // 為, #39 832 0x7121, // 無, #107 833 0x7136, // 然, #215 834 0x7167, // 照, #376 835 0x71B1, // 熱, #245 836 0x7247, // 片, #90 837 0x7248, // 版, #112 838 0x724C, // 牌, #467 839 0x7269, // 物, #110 840 0x7279, // 特, #183 841 0x738B, // 王, #287 842 0x73A9, // 玩, #354 843 0x73FE, // 現, #143 844 0x7403, // 球, #350 845 0x7406, // 理, #105 846 0x751F, // 生, #24 847 0x7522, // 產, #201 848 0x7528, // 用, #17 849 0x7531, // 由, #288 850 0x7537, // 男, #298 851 0x754C, // 界, #399 852 0x7559, // 留, #218 853 0x756B, // 畫, #412 854 0x7576, // 當, #185 855 0x767B, // 登, #138 856 0x767C, // 發, #28 857 0x767D, // 白, #377 858 0x767E, // 百, #393 859 0x7684, // 的, #1 860 0x76EE, // 目, #271 861 0x76F4, // 直, #379 862 0x76F8, // 相, #98 863 0x770B, // 看, #52 864 0x771F, // 真, #180 865 0x773C, // 眼, #433 866 0x77E5, // 知, #170 867 0x78BC, // 碼, #481 868 0x793A, // 示, #353 869 0x793E, // 社, #333 870 0x795E, // 神, #304 871 0x7968, // 票, #477 872 0x798F, // 福, #494 873 0x79C1, // 私, #507 874 0x79D1, // 科, #280 875 0x7A0B, // 程, #272 876 0x7A2E, // 種, #337 877 0x7A4D, // 積, #385 878 0x7A7A, // 空, #324 879 0x7ACB, // 立, #286 880 0x7AD9, // 站, #117 881 0x7AE0, // 章, #141 882 0x7B2C, // 第, #135 883 0x7B49, // 等, #240 884 0x7BA1, // 管, #340 885 0x7BC0, // 節, #431 886 0x7BC7, // 篇, #479 887 0x7C21, // 簡, #499 888 0x7CBE, // 精, #213 889 0x7CFB, // 系, #212 890 0x7D04, // 約, #462 891 0x7D05, // 紅, #452 892 0x7D1A, // 級, #267 893 0x7D30, // 細, #486 894 0x7D44, // 組, #335 895 0x7D50, // 結, #243 896 0x7D66, // 給, #355 897 0x7D71, // 統, #375 898 0x7D93, // 經, #111 899 0x7DB2, // 網, #32 900 0x7DDA, // 線, #151 901 0x7E23, // 縣, #439 902 0x7E3D, // 總, #370 903 0x7F8E, // 美, #41 904 0x7FA9, // 義, #504 905 0x8001, // 老, #290 906 0x8003, // 考, #428 907 0x8005, // 者, #92 908 0x800C, // 而, #217 909 0x805E, // 聞, #181 910 0x806F, // 聯, #310 911 0x8072, // 聲, #413 912 0x80A1, // 股, #390 913 0x80B2, // 育, #453 914 0x80FD, // 能, #71 915 0x8166, // 腦, #408 916 0x81EA, // 自, #61 917 0x81F3, // 至, #344 918 0x8207, // 與, #84 919 0x8209, // 舉, #463 920 0x8272, // 色, #192 921 0x82B1, // 花, #255 922 0x82F1, // 英, #348 923 0x83EF, // 華, #196 924 0x842C, // 萬, #316 925 0x843D, // 落, #308 926 0x8457, // 著, #233 927 0x85A6, // 薦, #401 928 0x85CF, // 藏, #503 929 0x85DD, // 藝, #488 930 0x8655, // 處, #419 931 0x865F, // 號, #191 932 0x884C, // 行, #47 933 0x8853, // 術, #395 934 0x8868, // 表, #77 935 0x88AB, // 被, #291 936 0x88DD, // 裝, #256 937 0x88E1, // 裡, #369 938 0x88FD, // 製, #510 939 0x897F, // 西, #300 940 0x8981, // 要, #36 941 0x898B, // 見, #307 942 0x8996, // 視, #204 943 0x89BA, // 覺, #450 944 0x89BD, // 覽, #387 945 0x89C0, // 觀, #365 946 0x89E3, // 解, #323 947 0x8A00, // 言, #169 948 0x8A02, // 訂, #423 949 0x8A08, // 計, #225 950 0x8A0A, // 訊, #156 951 0x8A0E, // 討, #373 952 0x8A18, // 記, #222 953 0x8A2D, // 設, #174 954 0x8A3B, // 註, #356 955 0x8A55, // 評, #246 956 0x8A66, // 試, #448 957 0x8A71, // 話, #229 958 0x8A72, // 該, #446 959 0x8A8D, // 認, #464 960 0x8A9E, // 語, #371 961 0x8AAA, // 說, #91 962 0x8ABF, // 調, #509 963 0x8ACB, // 請, #119 964 0x8AD6, // 論, #114 965 0x8B1D, // 謝, #389 966 0x8B49, // 證, #429 967 0x8B58, // 識, #416 968 0x8B70, // 議, #485 969 0x8B77, // 護, #475 970 0x8B80, // 讀, #386 971 0x8B8A, // 變, #388 972 0x8B93, // 讓, #336 973 0x8CA8, // 貨, #313 974 0x8CB7, // 買, #260 975 0x8CBB, // 費, #203 976 0x8CC7, // 資, #62 977 0x8CE3, // 賣, #294 978 0x8CEA, // 質, #457 979 0x8CFC, // 購, #189 980 0x8D77, // 起, #214 981 0x8D85, // 超, #296 982 0x8DDF, // 跟, #489 983 0x8DEF, // 路, #137 984 0x8EAB, // 身, #197 985 0x8ECA, // 車, #76 986 0x8F09, // 載, #301 987 0x8F49, // 轉, #282 988 0x8FD1, // 近, #414 989 0x9001, // 送, #363 990 0x9019, // 這, #42 991 0x901A, // 通, #207 992 0x901F, // 速, #495 993 0x9020, // 造, #455 994 0x9023, // 連, #285 995 0x9032, // 進, #231 996 0x904A, // 遊, #132 997 0x904B, // 運, #219 998 0x904E, // 過, #101 999 0x9053, // 道, #146 1000 0x9054, // 達, #417 1001 0x9078, // 選, #182 1002 0x9084, // 還, #154 1003 0x908A, // 邊, #487 1004 0x90A3, // 那, #269 1005 0x90E8, // 部, #78 1006 0x90FD, // 都, #104 1007 0x914D, // 配, #421 1008 0x9152, // 酒, #512 1009 0x91AB, // 醫, #358 1010 0x91CD, // 重, #224 1011 0x91CF, // 量, #319 1012 0x91D1, // 金, #115 1013 0x9304, // 錄, #302 1014 0x9577, // 長, #172 1015 0x9580, // 門, #193 1016 0x958B, // 開, #72 1017 0x9593, // 間, #80 1018 0x95B1, // 閱, #405 1019 0x95DC, // 關, #74 1020 0x963F, // 阿, #460 1021 0x9650, // 限, #265 1022 0x9662, // 院, #474 1023 0x9664, // 除, #478 1024 0x969B, // 際, #459 1025 0x96C6, // 集, #347 1026 0x96E2, // 離, #442 1027 0x96FB, // 電, #33 1028 0x9700, // 需, #445 1029 0x975E, // 非, #451 1030 0x9762, // 面, #129 1031 0x97F3, // 音, #194 1032 0x9801, // 頁, #83 1033 0x982D, // 頭, #238 1034 0x984C, // 題, #122 1035 0x985E, // 類, #163 1036 0x98A8, // 風, #266 1037 0x98DF, // 食, #208 1038 0x9910, // 餐, #469 1039 0x9928, // 館, #424 1040 0x9996, // 首, #166 1041 0x9999, // 香, #263 1042 0x99AC, // 馬, #317 1043 0x9A57, // 驗, #492 1044 0x9AD4, // 體, #100 1045 0x9AD8, // 高, #88 1046 0x9EBC, // 麼, #241 1047 0x9EC3, // 黃, #480 1048 0x9ED1, // 黑, #490 1049 0x9EDE, // 點, #69 1050 0x9F8D, // 龍, #505 1051 }; 1052 // the percentage of the sample covered by the above characters 1053 static const float frequent_zhTW_coverage=0.704841200026877; 1054 1055 // The 512 most frequently occuring characters for the ja language in a sample of the Internet. 1056 // Ordered by codepoint, comment shows character and ranking by frequency 1057 const uint16_t frequent_ja[] = { 1058 0x3005, // 々, #352 1059 0x3041, // ぁ, #486 1060 0x3042, // あ, #50 1061 0x3044, // い, #2 1062 0x3046, // う, #33 1063 0x3048, // え, #83 1064 0x304A, // お, #37 1065 0x304B, // か, #21 1066 0x304C, // が, #17 1067 0x304D, // き, #51 1068 0x304E, // ぎ, #324 1069 0x304F, // く, #38 1070 0x3050, // ぐ, #334 1071 0x3051, // け, #60 1072 0x3052, // げ, #296 1073 0x3053, // こ, #34 1074 0x3054, // ご, #100 1075 0x3055, // さ, #31 1076 0x3056, // ざ, #378 1077 0x3057, // し, #4 1078 0x3058, // じ, #121 1079 0x3059, // す, #12 1080 0x305A, // ず, #215 1081 0x305B, // せ, #86 1082 0x305D, // そ, #68 1083 0x305F, // た, #11 1084 0x3060, // だ, #42 1085 0x3061, // ち, #67 1086 0x3063, // っ, #23 1087 0x3064, // つ, #73 1088 0x3066, // て, #7 1089 0x3067, // で, #6 1090 0x3068, // と, #14 1091 0x3069, // ど, #75 1092 0x306A, // な, #8 1093 0x306B, // に, #5 1094 0x306D, // ね, #123 1095 0x306E, // の, #1 1096 0x306F, // は, #16 1097 0x3070, // ば, #150 1098 0x3071, // ぱ, #259 1099 0x3072, // ひ, #364 1100 0x3073, // び, #266 1101 0x3075, // ふ, #484 1102 0x3076, // ぶ, #330 1103 0x3078, // へ, #146 1104 0x3079, // べ, #207 1105 0x307B, // ほ, #254 1106 0x307E, // ま, #18 1107 0x307F, // み, #74 1108 0x3080, // む, #285 1109 0x3081, // め, #78 1110 0x3082, // も, #32 1111 0x3083, // ゃ, #111 1112 0x3084, // や, #85 1113 0x3086, // ゆ, #392 1114 0x3087, // ょ, #224 1115 0x3088, // よ, #63 1116 0x3089, // ら, #29 1117 0x308A, // り, #28 1118 0x308B, // る, #9 1119 0x308C, // れ, #35 1120 0x308D, // ろ, #127 1121 0x308F, // わ, #88 1122 0x3092, // を, #19 1123 0x3093, // ん, #22 1124 0x30A1, // ァ, #193 1125 0x30A2, // ア, #27 1126 0x30A3, // ィ, #70 1127 0x30A4, // イ, #15 1128 0x30A6, // ウ, #89 1129 0x30A7, // ェ, #134 1130 0x30A8, // エ, #81 1131 0x30A9, // ォ, #225 1132 0x30AA, // オ, #76 1133 0x30AB, // カ, #52 1134 0x30AC, // ガ, #147 1135 0x30AD, // キ, #66 1136 0x30AE, // ギ, #246 1137 0x30AF, // ク, #25 1138 0x30B0, // グ, #39 1139 0x30B1, // ケ, #137 1140 0x30B2, // ゲ, #200 1141 0x30B3, // コ, #46 1142 0x30B4, // ゴ, #183 1143 0x30B5, // サ, #64 1144 0x30B6, // ザ, #221 1145 0x30B7, // シ, #48 1146 0x30B8, // ジ, #55 1147 0x30B9, // ス, #13 1148 0x30BA, // ズ, #103 1149 0x30BB, // セ, #109 1150 0x30BC, // ゼ, #499 1151 0x30BD, // ソ, #175 1152 0x30BF, // タ, #45 1153 0x30C0, // ダ, #104 1154 0x30C1, // チ, #71 1155 0x30C3, // ッ, #20 1156 0x30C4, // ツ, #119 1157 0x30C6, // テ, #59 1158 0x30C7, // デ, #82 1159 0x30C8, // ト, #10 1160 0x30C9, // ド, #44 1161 0x30CA, // ナ, #102 1162 0x30CB, // ニ, #72 1163 0x30CD, // ネ, #117 1164 0x30CE, // ノ, #192 1165 0x30CF, // ハ, #164 1166 0x30D0, // バ, #62 1167 0x30D1, // パ, #90 1168 0x30D2, // ヒ, #398 1169 0x30D3, // ビ, #77 1170 0x30D4, // ピ, #135 1171 0x30D5, // フ, #47 1172 0x30D6, // ブ, #56 1173 0x30D7, // プ, #43 1174 0x30D8, // ヘ, #268 1175 0x30D9, // ベ, #157 1176 0x30DA, // ペ, #125 1177 0x30DB, // ホ, #155 1178 0x30DC, // ボ, #168 1179 0x30DD, // ポ, #114 1180 0x30DE, // マ, #57 1181 0x30DF, // ミ, #97 1182 0x30E0, // ム, #69 1183 0x30E1, // メ, #53 1184 0x30E2, // モ, #142 1185 0x30E3, // ャ, #93 1186 0x30E4, // ヤ, #258 1187 0x30E5, // ュ, #79 1188 0x30E6, // ユ, #405 1189 0x30E7, // ョ, #98 1190 0x30E9, // ラ, #26 1191 0x30EA, // リ, #30 1192 0x30EB, // ル, #24 1193 0x30EC, // レ, #41 1194 0x30ED, // ロ, #40 1195 0x30EF, // ワ, #144 1196 0x30F3, // ン, #3 1197 0x30F4, // ヴ, #483 1198 0x30FD, // ヽ, #501 1199 0x4E00, // 一, #84 1200 0x4E07, // 万, #337 1201 0x4E09, // 三, #323 1202 0x4E0A, // 上, #133 1203 0x4E0B, // 下, #180 1204 0x4E0D, // 不, #277 1205 0x4E16, // 世, #385 1206 0x4E2D, // 中, #87 1207 0x4E3B, // 主, #432 1208 0x4E88, // 予, #326 1209 0x4E8B, // 事, #95 1210 0x4E8C, // 二, #394 1211 0x4E95, // 井, #468 1212 0x4EA4, // 交, #410 1213 0x4EAC, // 京, #260 1214 0x4EBA, // 人, #61 1215 0x4ECA, // 今, #184 1216 0x4ECB, // 介, #358 1217 0x4ED5, // 仕, #391 1218 0x4ED6, // 他, #256 1219 0x4ED8, // 付, #243 1220 0x4EE3, // 代, #280 1221 0x4EE5, // 以, #216 1222 0x4EF6, // 件, #190 1223 0x4F1A, // 会, #105 1224 0x4F4D, // 位, #177 1225 0x4F4F, // 住, #376 1226 0x4F53, // 体, #223 1227 0x4F55, // 何, #294 1228 0x4F5C, // 作, #154 1229 0x4F7F, // 使, #233 1230 0x4F9B, // 供, #503 1231 0x4FA1, // 価, #217 1232 0x4FBF, // 便, #511 1233 0x4FDD, // 保, #279 1234 0x4FE1, // 信, #271 1235 0x500B, // 個, #415 1236 0x50CF, // 像, #178 1237 0x512A, // 優, #403 1238 0x5143, // 元, #384 1239 0x5148, // 先, #311 1240 0x5149, // 光, #488 1241 0x5165, // 入, #115 1242 0x5168, // 全, #173 1243 0x516C, // 公, #287 1244 0x5177, // 具, #447 1245 0x5185, // 内, #169 1246 0x5186, // 円, #131 1247 0x5199, // 写, #275 1248 0x51FA, // 出, #110 1249 0x5206, // 分, #130 1250 0x5207, // 切, #401 1251 0x521D, // 初, #319 1252 0x5225, // 別, #290 1253 0x5229, // 利, #226 1254 0x5236, // 制, #507 1255 0x524D, // 前, #124 1256 0x529B, // 力, #272 1257 0x52A0, // 加, #249 1258 0x52D5, // 動, #120 1259 0x52D9, // 務, #421 1260 0x52DF, // 募, #476 1261 0x5316, // 化, #308 1262 0x5317, // 北, #341 1263 0x533A, // 区, #348 1264 0x539F, // 原, #321 1265 0x53C2, // 参, #452 1266 0x53CB, // 友, #451 1267 0x53D6, // 取, #237 1268 0x53D7, // 受, #354 1269 0x53E3, // 口, #289 1270 0x53E4, // 古, #339 1271 0x53EF, // 可, #298 1272 0x53F0, // 台, #439 1273 0x53F7, // 号, #361 1274 0x5408, // 合, #118 1275 0x540C, // 同, #263 1276 0x540D, // 名, #65 1277 0x5411, // 向, #434 1278 0x544A, // 告, #386 1279 0x5468, // 周, #393 1280 0x5473, // 味, #299 1281 0x548C, // 和, #350 1282 0x54C1, // 品, #96 1283 0x54E1, // 員, #293 1284 0x5546, // 商, #198 1285 0x554F, // 問, #158 1286 0x55B6, // 営, #438 1287 0x5668, // 器, #366 1288 0x56DE, // 回, #143 1289 0x56F3, // 図, #444 1290 0x56FD, // 国, #153 1291 0x5712, // 園, #435 1292 0x571F, // 土, #239 1293 0x5728, // 在, #351 1294 0x5730, // 地, #163 1295 0x578B, // 型, #430 1296 0x5831, // 報, #112 1297 0x5834, // 場, #139 1298 0x58F2, // 売, #232 1299 0x5909, // 変, #306 1300 0x5916, // 外, #222 1301 0x591A, // 多, #336 1302 0x5927, // 大, #80 1303 0x5929, // 天, #278 1304 0x5973, // 女, #161 1305 0x597D, // 好, #349 1306 0x5A5A, // 婚, #479 1307 0x5B50, // 子, #113 1308 0x5B57, // 字, #492 1309 0x5B66, // 学, #132 1310 0x5B89, // 安, #295 1311 0x5B9A, // 定, #145 1312 0x5B9F, // 実, #220 1313 0x5BA4, // 室, #482 1314 0x5BAE, // 宮, #487 1315 0x5BB6, // 家, #211 1316 0x5BB9, // 容, #333 1317 0x5BFE, // 対, #252 1318 0x5C02, // 専, #474 1319 0x5C0F, // 小, #212 1320 0x5C11, // 少, #377 1321 0x5C4B, // 屋, #284 1322 0x5C71, // 山, #206 1323 0x5CA1, // 岡, #429 1324 0x5CF6, // 島, #297 1325 0x5DDD, // 川, #253 1326 0x5DE5, // 工, #374 1327 0x5E02, // 市, #159 1328 0x5E2F, // 帯, #416 1329 0x5E38, // 常, #437 1330 0x5E73, // 平, #390 1331 0x5E74, // 年, #54 1332 0x5E83, // 広, #367 1333 0x5E97, // 店, #149 1334 0x5EA6, // 度, #269 1335 0x5EAB, // 庫, #380 1336 0x5F0F, // 式, #265 1337 0x5F15, // 引, #345 1338 0x5F37, // 強, #446 1339 0x5F53, // 当, #240 1340 0x5F62, // 形, #502 1341 0x5F8C, // 後, #230 1342 0x5F97, // 得, #490 1343 0x5FC3, // 心, #307 1344 0x5FC5, // 必, #422 1345 0x5FDC, // 応, #356 1346 0x601D, // 思, #189 1347 0x6027, // 性, #201 1348 0x6075, // 恵, #400 1349 0x60C5, // 情, #140 1350 0x60F3, // 想, #477 1351 0x610F, // 意, #305 1352 0x611B, // 愛, #273 1353 0x611F, // 感, #257 1354 0x6210, // 成, #262 1355 0x6226, // 戦, #365 1356 0x6240, // 所, #236 1357 0x624B, // 手, #160 1358 0x6295, // 投, #129 1359 0x6301, // 持, #355 1360 0x6307, // 指, #425 1361 0x63A2, // 探, #369 1362 0x63B2, // 掲, #399 1363 0x643A, // 携, #459 1364 0x652F, // 支, #512 1365 0x653E, // 放, #469 1366 0x6559, // 教, #270 1367 0x6570, // 数, #181 1368 0x6587, // 文, #202 1369 0x6599, // 料, #106 1370 0x65B0, // 新, #99 1371 0x65B9, // 方, #126 1372 0x65C5, // 旅, #445 1373 0x65E5, // 日, #36 1374 0x660E, // 明, #300 1375 0x6620, // 映, #418 1376 0x6642, // 時, #107 1377 0x66F4, // 更, #359 1378 0x66F8, // 書, #174 1379 0x6700, // 最, #152 1380 0x6708, // 月, #49 1381 0x6709, // 有, #302 1382 0x671F, // 期, #332 1383 0x6728, // 木, #203 1384 0x672C, // 本, #92 1385 0x6750, // 材, #489 1386 0x6751, // 村, #466 1387 0x6765, // 来, #267 1388 0x6771, // 東, #191 1389 0x677F, // 板, #411 1390 0x679C, // 果, #441 1391 0x6821, // 校, #327 1392 0x682A, // 株, #412 1393 0x683C, // 格, #228 1394 0x691C, // 検, #179 1395 0x696D, // 業, #166 1396 0x697D, // 楽, #172 1397 0x69D8, // 様, #255 1398 0x6A5F, // 機, #235 1399 0x6B21, // 次, #318 1400 0x6B62, // 止, #475 1401 0x6B63, // 正, #312 1402 0x6C17, // 気, #116 1403 0x6C34, // 水, #165 1404 0x6C42, // 求, #465 1405 0x6C7A, // 決, #370 1406 0x6CBB, // 治, #505 1407 0x6CC1, // 況, #462 1408 0x6CD5, // 法, #227 1409 0x6CE8, // 注, #372 1410 0x6D3B, // 活, #303 1411 0x6D41, // 流, #480 1412 0x6D77, // 海, #274 1413 0x6E08, // 済, #417 1414 0x6F14, // 演, #504 1415 0x706B, // 火, #264 1416 0x70B9, // 点, #331 1417 0x7121, // 無, #58 1418 0x7248, // 版, #409 1419 0x7269, // 物, #170 1420 0x7279, // 特, #242 1421 0x72B6, // 状, #458 1422 0x73FE, // 現, #322 1423 0x7406, // 理, #162 1424 0x751F, // 生, #122 1425 0x7523, // 産, #320 1426 0x7528, // 用, #94 1427 0x7530, // 田, #195 1428 0x7537, // 男, #373 1429 0x753A, // 町, #314 1430 0x753B, // 画, #91 1431 0x754C, // 界, #436 1432 0x756A, // 番, #261 1433 0x75C5, // 病, #428 1434 0x767A, // 発, #194 1435 0x767B, // 登, #231 1436 0x767D, // 白, #419 1437 0x7684, // 的, #251 1438 0x76EE, // 目, #197 1439 0x76F4, // 直, #497 1440 0x76F8, // 相, #286 1441 0x770C, // 県, #199 1442 0x771F, // 真, #219 1443 0x7740, // 着, #283 1444 0x77E5, // 知, #185 1445 0x77F3, // 石, #500 1446 0x78BA, // 確, #383 1447 0x793A, // 示, #241 1448 0x793E, // 社, #167 1449 0x795E, // 神, #315 1450 0x798F, // 福, #423 1451 0x79C1, // 私, #347 1452 0x79D1, // 科, #420 1453 0x7A0E, // 税, #368 1454 0x7A2E, // 種, #455 1455 0x7A3F, // 稿, #148 1456 0x7A7A, // 空, #427 1457 0x7ACB, // 立, #309 1458 0x7B11, // 笑, #454 1459 0x7B2C, // 第, #317 1460 0x7B49, // 等, #457 1461 0x7B54, // 答, #426 1462 0x7BA1, // 管, #481 1463 0x7CFB, // 系, #408 1464 0x7D04, // 約, #276 1465 0x7D20, // 素, #407 1466 0x7D22, // 索, #214 1467 0x7D30, // 細, #381 1468 0x7D39, // 紹, #471 1469 0x7D42, // 終, #456 1470 0x7D44, // 組, #424 1471 0x7D4C, // 経, #360 1472 0x7D50, // 結, #291 1473 0x7D9A, // 続, #357 1474 0x7DCF, // 総, #467 1475 0x7DDA, // 線, #338 1476 0x7DE8, // 編, #453 1477 0x7F8E, // 美, #204 1478 0x8003, // 考, #387 1479 0x8005, // 者, #151 1480 0x805E, // 聞, #463 1481 0x8077, // 職, #363 1482 0x80B2, // 育, #433 1483 0x80FD, // 能, #250 1484 0x8179, // 腹, #396 1485 0x81EA, // 自, #156 1486 0x826F, // 良, #329 1487 0x8272, // 色, #402 1488 0x82B1, // 花, #440 1489 0x82B8, // 芸, #413 1490 0x82F1, // 英, #485 1491 0x8449, // 葉, #472 1492 0x884C, // 行, #128 1493 0x8853, // 術, #460 1494 0x8868, // 表, #209 1495 0x88FD, // 製, #431 1496 0x897F, // 西, #406 1497 0x8981, // 要, #313 1498 0x898B, // 見, #101 1499 0x898F, // 規, #375 1500 0x89A7, // 覧, #171 1501 0x89E3, // 解, #388 1502 0x8A00, // 言, #210 1503 0x8A08, // 計, #343 1504 0x8A18, // 記, #136 1505 0x8A2D, // 設, #292 1506 0x8A71, // 話, #213 1507 0x8A73, // 詳, #371 1508 0x8A8D, // 認, #404 1509 0x8A9E, // 語, #234 1510 0x8AAC, // 説, #494 1511 0x8AAD, // 読, #301 1512 0x8ABF, // 調, #443 1513 0x8AC7, // 談, #448 1514 0x8B77, // 護, #509 1515 0x8C37, // 谷, #506 1516 0x8CA9, // 販, #362 1517 0x8CB7, // 買, #346 1518 0x8CC7, // 資, #473 1519 0x8CEA, // 質, #281 1520 0x8CFC, // 購, #495 1521 0x8EAB, // 身, #470 1522 0x8ECA, // 車, #205 1523 0x8EE2, // 転, #335 1524 0x8F09, // 載, #342 1525 0x8FBC, // 込, #229 1526 0x8FD1, // 近, #304 1527 0x8FD4, // 返, #461 1528 0x8FFD, // 追, #379 1529 0x9001, // 送, #186 1530 0x901A, // 通, #182 1531 0x901F, // 速, #340 1532 0x9023, // 連, #244 1533 0x904B, // 運, #382 1534 0x904E, // 過, #498 1535 0x9053, // 道, #282 1536 0x9054, // 達, #450 1537 0x9055, // 違, #414 1538 0x9078, // 選, #288 1539 0x90E8, // 部, #208 1540 0x90FD, // 都, #344 1541 0x914D, // 配, #389 1542 0x91CD, // 重, #478 1543 0x91CE, // 野, #245 1544 0x91D1, // 金, #138 1545 0x9332, // 録, #238 1546 0x9577, // 長, #247 1547 0x9580, // 門, #508 1548 0x958B, // 開, #248 1549 0x9593, // 間, #141 1550 0x95A2, // 関, #188 1551 0x962A, // 阪, #496 1552 0x9650, // 限, #395 1553 0x9662, // 院, #449 1554 0x9664, // 除, #510 1555 0x969B, // 際, #493 1556 0x96C6, // 集, #196 1557 0x96D1, // 雑, #442 1558 0x96FB, // 電, #187 1559 0x9762, // 面, #328 1560 0x97F3, // 音, #325 1561 0x984C, // 題, #310 1562 0x985E, // 類, #491 1563 0x98A8, // 風, #353 1564 0x98DF, // 食, #218 1565 0x9928, // 館, #464 1566 0x99C5, // 駅, #316 1567 0x9A13, // 験, #397 1568 0x9AD8, // 高, #176 1569 0xFF57, // w, #108 1570 }; 1571 // the percentage of the sample covered by the above characters 1572 static const float frequent_ja_coverage=0.880569589120162; 1573 1574 // The 512 most frequently occuring characters for the ko language in a sample of the Internet. 1575 // Ordered by codepoint, comment shows character and ranking by frequency 1576 const uint16_t frequent_ko[] = { 1577 0x314B, // ㅋ, #148 1578 0x314E, // ㅎ, #390 1579 0x3160, // ㅠ, #354 1580 0x318D, // ㆍ, #439 1581 0xAC00, // 가, #6 1582 0xAC01, // 각, #231 1583 0xAC04, // 간, #106 1584 0xAC08, // 갈, #362 1585 0xAC10, // 감, #122 1586 0xAC11, // 갑, #493 1587 0xAC15, // 강, #155 1588 0xAC19, // 같, #264 1589 0xAC1C, // 개, #87 1590 0xAC1D, // 객, #198 1591 0xAC24, // 갤, #457 1592 0xAC70, // 거, #91 1593 0xAC74, // 건, #161 1594 0xAC78, // 걸, #338 1595 0xAC80, // 검, #184 1596 0xAC83, // 것, #116 1597 0xAC8C, // 게, #36 1598 0xACA0, // 겠, #233 1599 0xACA8, // 겨, #341 1600 0xACA9, // 격, #245 1601 0xACAC, // 견, #413 1602 0xACB0, // 결, #202 1603 0xACBD, // 경, #62 1604 0xACC4, // 계, #142 1605 0xACE0, // 고, #12 1606 0xACE1, // 곡, #444 1607 0xACE8, // 골, #379 1608 0xACF3, // 곳, #388 1609 0xACF5, // 공, #59 1610 0xACFC, // 과, #69 1611 0xAD00, // 관, #95 1612 0xAD11, // 광, #235 1613 0xAD50, // 교, #128 1614 0xAD6C, // 구, #52 1615 0xAD6D, // 국, #85 1616 0xAD70, // 군, #293 1617 0xAD74, // 굴, #487 1618 0xAD81, // 궁, #441 1619 0xAD8C, // 권, #192 1620 0xADC0, // 귀, #386 1621 0xADDC, // 규, #367 1622 0xADF8, // 그, #30 1623 0xADF9, // 극, #424 1624 0xADFC, // 근, #241 1625 0xAE00, // 글, #61 1626 0xAE08, // 금, #138 1627 0xAE09, // 급, #269 1628 0xAE30, // 기, #3 1629 0xAE34, // 긴, #465 1630 0xAE38, // 길, #297 1631 0xAE40, // 김, #205 1632 0xAE4C, // 까, #171 1633 0xAED8, // 께, #273 1634 0xAF43, // 꽃, #475 1635 0xB05D, // 끝, #505 1636 0xB07C, // 끼, #490 1637 0xB098, // 나, #39 1638 0xB09C, // 난, #274 1639 0xB0A0, // 날, #292 1640 0xB0A8, // 남, #139 1641 0xB0B4, // 내, #56 1642 0xB108, // 너, #272 1643 0xB110, // 널, #476 1644 0xB118, // 넘, #492 1645 0xB124, // 네, #100 1646 0xB137, // 넷, #329 1647 0xB140, // 녀, #288 1648 0xB144, // 년, #151 1649 0xB178, // 노, #149 1650 0xB17C, // 논, #491 1651 0xB180, // 놀, #464 1652 0xB18D, // 농, #442 1653 0xB204, // 누, #319 1654 0xB208, // 눈, #383 1655 0xB274, // 뉴, #173 1656 0xB290, // 느, #368 1657 0xB294, // 는, #5 1658 0xB298, // 늘, #322 1659 0xB2A5, // 능, #190 1660 0xB2C8, // 니, #16 1661 0xB2D8, // 님, #153 1662 0xB2E4, // 다, #2 1663 0xB2E8, // 단, #134 1664 0xB2EB, // 닫, #195 1665 0xB2EC, // 달, #243 1666 0xB2F4, // 담, #254 1667 0xB2F5, // 답, #287 1668 0xB2F9, // 당, #159 1669 0xB300, // 대, #33 1670 0xB313, // 댓, #303 1671 0xB354, // 더, #140 1672 0xB358, // 던, #252 1673 0xB367, // 덧, #463 1674 0xB370, // 데, #104 1675 0xB378, // 델, #429 1676 0xB3C4, // 도, #25 1677 0xB3C5, // 독, #301 1678 0xB3CC, // 돌, #309 1679 0xB3D9, // 동, #58 1680 0xB418, // 되, #82 1681 0xB41C, // 된, #189 1682 0xB420, // 될, #408 1683 0xB429, // 됩, #332 1684 0xB450, // 두, #199 1685 0xB4A4, // 뒤, #496 1686 0xB4DC, // 드, #40 1687 0xB4E0, // 든, #283 1688 0xB4E4, // 들, #54 1689 0xB4EF, // 듯, #478 1690 0xB4F1, // 등, #90 1691 0xB514, // 디, #133 1692 0xB529, // 딩, #462 1693 0xB530, // 따, #333 1694 0xB54C, // 때, #240 1695 0xB610, // 또, #313 1696 0xB77C, // 라, #42 1697 0xB77D, // 락, #355 1698 0xB780, // 란, #290 1699 0xB78C, // 람, #246 1700 0xB78D, // 랍, #420 1701 0xB791, // 랑, #270 1702 0xB798, // 래, #174 1703 0xB799, // 랙, #381 1704 0xB79C, // 랜, #357 1705 0xB7A8, // 램, #359 1706 0xB7A9, // 랩, #402 1707 0xB7C9, // 량, #346 1708 0xB7EC, // 러, #130 1709 0xB7F0, // 런, #312 1710 0xB7FC, // 럼, #327 1711 0xB7FD, // 럽, #447 1712 0xB807, // 렇, #412 1713 0xB808, // 레, #114 1714 0xB80C, // 렌, #395 1715 0xB824, // 려, #158 1716 0xB825, // 력, #194 1717 0xB828, // 련, #326 1718 0xB839, // 령, #389 1719 0xB85C, // 로, #4 1720 0xB85D, // 록, #84 1721 0xB860, // 론, #366 1722 0xB8CC, // 료, #154 1723 0xB8E8, // 루, #236 1724 0xB958, // 류, #265 1725 0xB974, // 르, #212 1726 0xB978, // 른, #250 1727 0xB97C, // 를, #35 1728 0xB984, // 름, #276 1729 0xB9AC, // 리, #19 1730 0xB9AD, // 릭, #394 1731 0xB9B0, // 린, #259 1732 0xB9B4, // 릴, #485 1733 0xB9BC, // 림, #305 1734 0xB9BD, // 립, #217 1735 0xB9C1, // 링, #351 1736 0xB9C8, // 마, #67 1737 0xB9C9, // 막, #310 1738 0xB9CC, // 만, #65 1739 0xB9CE, // 많, #257 1740 0xB9D0, // 말, #188 1741 0xB9DB, // 맛, #397 1742 0xB9DD, // 망, #370 1743 0xB9DE, // 맞, #399 1744 0xB9E4, // 매, #125 1745 0xB9E8, // 맨, #422 1746 0xBA38, // 머, #311 1747 0xBA39, // 먹, #377 1748 0xBA3C, // 먼, #469 1749 0xBA54, // 메, #147 1750 0xBA70, // 며, #191 1751 0xBA74, // 면, #72 1752 0xBA85, // 명, #131 1753 0xBAA8, // 모, #73 1754 0xBAA9, // 목, #157 1755 0xBAB0, // 몰, #401 1756 0xBAB8, // 몸, #437 1757 0xBABB, // 못, #336 1758 0xBB34, // 무, #80 1759 0xBB38, // 문, #57 1760 0xBB3C, // 물, #94 1761 0xBBA4, // 뮤, #431 1762 0xBBF8, // 미, #76 1763 0xBBFC, // 민, #200 1764 0xBC00, // 밀, #308 1765 0xBC0F, // 및, #249 1766 0xBC14, // 바, #89 1767 0xBC15, // 박, #226 1768 0xBC18, // 반, #175 1769 0xBC1B, // 받, #248 1770 0xBC1C, // 발, #164 1771 0xBC29, // 방, #92 1772 0xBC30, // 배, #162 1773 0xBC31, // 백, #256 1774 0xBC84, // 버, #111 1775 0xBC88, // 번, #167 1776 0xBC8C, // 벌, #423 1777 0xBC94, // 범, #427 1778 0xBC95, // 법, #207 1779 0xBCA0, // 베, #281 1780 0xBCA4, // 벤, #378 1781 0xBCA8, // 벨, #387 1782 0xBCC0, // 변, #253 1783 0xBCC4, // 별, #262 1784 0xBCD1, // 병, #340 1785 0xBCF4, // 보, #20 1786 0xBCF5, // 복, #204 1787 0xBCF8, // 본, #182 1788 0xBCFC, // 볼, #385 1789 0xBD09, // 봉, #405 1790 0xBD80, // 부, #46 1791 0xBD81, // 북, #261 1792 0xBD84, // 분, #105 1793 0xBD88, // 불, #225 1794 0xBDF0, // 뷰, #350 1795 0xBE0C, // 브, #214 1796 0xBE14, // 블, #99 1797 0xBE44, // 비, #55 1798 0xBE4C, // 빌, #510 1799 0xBE60, // 빠, #398 1800 0xC0AC, // 사, #14 1801 0xC0AD, // 삭, #342 1802 0xC0B0, // 산, #121 1803 0xC0B4, // 살, #279 1804 0xC0BC, // 삼, #348 1805 0xC0C1, // 상, #41 1806 0xC0C8, // 새, #282 1807 0xC0C9, // 색, #181 1808 0xC0DD, // 생, #109 1809 0xC11C, // 서, #21 1810 0xC11D, // 석, #234 1811 0xC120, // 선, #107 1812 0xC124, // 설, #170 1813 0xC131, // 성, #50 1814 0xC138, // 세, #60 1815 0xC139, // 섹, #456 1816 0xC13C, // 센, #267 1817 0xC154, // 셔, #455 1818 0xC158, // 션, #237 1819 0xC15C, // 셜, #448 1820 0xC168, // 셨, #421 1821 0xC18C, // 소, #51 1822 0xC18D, // 속, #219 1823 0xC190, // 손, #323 1824 0xC1A1, // 송, #203 1825 0xC1C4, // 쇄, #501 1826 0xC1FC, // 쇼, #364 1827 0xC218, // 수, #27 1828 0xC219, // 숙, #467 1829 0xC21C, // 순, #258 1830 0xC220, // 술, #302 1831 0xC26C, // 쉬, #511 1832 0xC288, // 슈, #384 1833 0xC2A4, // 스, #11 1834 0xC2AC, // 슬, #438 1835 0xC2B4, // 슴, #504 1836 0xC2B5, // 습, #77 1837 0xC2B9, // 승, #299 1838 0xC2DC, // 시, #13 1839 0xC2DD, // 식, #137 1840 0xC2E0, // 신, #47 1841 0xC2E4, // 실, #132 1842 0xC2EC, // 심, #196 1843 0xC2ED, // 십, #482 1844 0xC2F6, // 싶, #352 1845 0xC2F8, // 싸, #419 1846 0xC4F0, // 쓰, #278 1847 0xC528, // 씨, #360 1848 0xC544, // 아, #23 1849 0xC545, // 악, #296 1850 0xC548, // 안, #71 1851 0xC54A, // 않, #209 1852 0xC54C, // 알, #222 1853 0xC554, // 암, #460 1854 0xC558, // 았, #349 1855 0xC559, // 앙, #473 1856 0xC55E, // 앞, #434 1857 0xC560, // 애, #271 1858 0xC561, // 액, #415 1859 0xC571, // 앱, #477 1860 0xC57C, // 야, #124 1861 0xC57D, // 약, #229 1862 0xC591, // 양, #177 1863 0xC5B4, // 어, #24 1864 0xC5B5, // 억, #407 1865 0xC5B8, // 언, #294 1866 0xC5BC, // 얼, #356 1867 0xC5C4, // 엄, #426 1868 0xC5C5, // 업, #118 1869 0xC5C6, // 없, #178 1870 0xC5C8, // 었, #165 1871 0xC5D0, // 에, #9 1872 0xC5D4, // 엔, #375 1873 0xC5D8, // 엘, #506 1874 0xC5EC, // 여, #66 1875 0xC5ED, // 역, #186 1876 0xC5EE, // 엮, #488 1877 0xC5F0, // 연, #96 1878 0xC5F4, // 열, #266 1879 0xC5FC, // 염, #449 1880 0xC600, // 였, #374 1881 0xC601, // 영, #83 1882 0xC608, // 예, #168 1883 0xC624, // 오, #75 1884 0xC628, // 온, #300 1885 0xC62C, // 올, #306 1886 0xC640, // 와, #119 1887 0xC644, // 완, #361 1888 0xC654, // 왔, #489 1889 0xC655, // 왕, #418 1890 0xC678, // 외, #218 1891 0xC694, // 요, #43 1892 0xC695, // 욕, #479 1893 0xC6A9, // 용, #48 1894 0xC6B0, // 우, #64 1895 0xC6B1, // 욱, #503 1896 0xC6B4, // 운, #108 1897 0xC6B8, // 울, #223 1898 0xC6C0, // 움, #317 1899 0xC6C3, // 웃, #404 1900 0xC6CC, // 워, #280 1901 0xC6D0, // 원, #45 1902 0xC6D4, // 월, #150 1903 0xC6E8, // 웨, #446 1904 0xC6F9, // 웹, #500 1905 0xC704, // 위, #78 1906 0xC720, // 유, #81 1907 0xC721, // 육, #321 1908 0xC724, // 윤, #416 1909 0xC73C, // 으, #49 1910 0xC740, // 은, #31 1911 0xC744, // 을, #17 1912 0xC74C, // 음, #112 1913 0xC751, // 응, #461 1914 0xC758, // 의, #8 1915 0xC774, // 이, #1 1916 0xC775, // 익, #403 1917 0xC778, // 인, #18 1918 0xC77C, // 일, #28 1919 0xC784, // 임, #160 1920 0xC785, // 입, #93 1921 0xC788, // 있, #44 1922 0xC790, // 자, #22 1923 0xC791, // 작, #88 1924 0xC798, // 잘, #347 1925 0xC7A1, // 잡, #372 1926 0xC7A5, // 장, #53 1927 0xC7AC, // 재, #120 1928 0xC7C1, // 쟁, #483 1929 0xC800, // 저, #98 1930 0xC801, // 적, #97 1931 0xC804, // 전, #34 1932 0xC808, // 절, #320 1933 0xC810, // 점, #201 1934 0xC811, // 접, #331 1935 0xC815, // 정, #26 1936 0xC81C, // 제, #29 1937 0xC838, // 져, #414 1938 0xC870, // 조, #86 1939 0xC871, // 족, #373 1940 0xC874, // 존, #432 1941 0xC880, // 좀, #470 1942 0xC885, // 종, #208 1943 0xC88B, // 좋, #239 1944 0xC8E0, // 죠, #451 1945 0xC8FC, // 주, #38 1946 0xC8FD, // 죽, #471 1947 0xC900, // 준, #286 1948 0xC904, // 줄, #392 1949 0xC911, // 중, #103 1950 0xC988, // 즈, #255 1951 0xC98C, // 즌, #507 1952 0xC990, // 즐, #371 1953 0xC99D, // 증, #260 1954 0xC9C0, // 지, #10 1955 0xC9C1, // 직, #216 1956 0xC9C4, // 진, #79 1957 0xC9C8, // 질, #238 1958 0xC9D1, // 집, #206 1959 0xC9DC, // 짜, #411 1960 0xC9F8, // 째, #494 1961 0xCABD, // 쪽, #435 1962 0xCC28, // 차, #146 1963 0xCC29, // 착, #443 1964 0xCC2C, // 찬, #481 1965 0xCC30, // 찰, #440 1966 0xCC38, // 참, #343 1967 0xCC3D, // 창, #304 1968 0xCC3E, // 찾, #335 1969 0xCC44, // 채, #284 1970 0xCC45, // 책, #298 1971 0xCC98, // 처, #242 1972 0xCC9C, // 천, #143 1973 0xCCA0, // 철, #380 1974 0xCCA8, // 첨, #452 1975 0xCCAB, // 첫, #484 1976 0xCCAD, // 청, #197 1977 0xCCB4, // 체, #126 1978 0xCCD0, // 쳐, #472 1979 0xCD08, // 초, #220 1980 0xCD1D, // 총, #406 1981 0xCD5C, // 최, #179 1982 0xCD94, // 추, #136 1983 0xCD95, // 축, #337 1984 0xCD9C, // 출, #166 1985 0xCDA9, // 충, #369 1986 0xCDE8, // 취, #210 1987 0xCE20, // 츠, #215 1988 0xCE21, // 측, #468 1989 0xCE35, // 층, #512 1990 0xCE58, // 치, #102 1991 0xCE5C, // 친, #325 1992 0xCE68, // 침, #263 1993 0xCE74, // 카, #115 1994 0xCE7C, // 칼, #466 1995 0xCE90, // 캐, #454 1996 0xCEE4, // 커, #285 1997 0xCEE8, // 컨, #328 1998 0xCEF4, // 컴, #417 1999 0xCF00, // 케, #339 2000 0xCF13, // 켓, #509 2001 0xCF1C, // 켜, #508 2002 0xCF54, // 코, #193 2003 0xCF58, // 콘, #391 2004 0xCFE0, // 쿠, #393 2005 0xD035, // 퀵, #453 2006 0xD06C, // 크, #101 2007 0xD070, // 큰, #495 2008 0xD074, // 클, #289 2009 0xD0A4, // 키, #230 2010 0xD0C0, // 타, #127 2011 0xD0C1, // 탁, #314 2012 0xD0C4, // 탄, #450 2013 0xD0C8, // 탈, #436 2014 0xD0DC, // 태, #221 2015 0xD0DD, // 택, #275 2016 0xD130, // 터, #70 2017 0xD14C, // 테, #213 2018 0xD150, // 텐, #324 2019 0xD154, // 텔, #430 2020 0xD15C, // 템, #382 2021 0xD1A0, // 토, #145 2022 0xD1B5, // 통, #156 2023 0xD22C, // 투, #227 2024 0xD2B8, // 트, #37 2025 0xD2B9, // 특, #247 2026 0xD2F0, // 티, #187 2027 0xD305, // 팅, #410 2028 0xD30C, // 파, #141 2029 0xD310, // 판, #163 2030 0xD314, // 팔, #499 2031 0xD328, // 패, #307 2032 0xD32C, // 팬, #459 2033 0xD338, // 팸, #433 2034 0xD37C, // 퍼, #344 2035 0xD398, // 페, #172 2036 0xD3B8, // 편, #251 2037 0xD3C9, // 평, #291 2038 0xD3EC, // 포, #68 2039 0xD3ED, // 폭, #445 2040 0xD3F0, // 폰, #318 2041 0xD45C, // 표, #232 2042 0xD480, // 풀, #497 2043 0xD488, // 품, #113 2044 0xD48D, // 풍, #425 2045 0xD504, // 프, #110 2046 0xD508, // 픈, #498 2047 0xD50C, // 플, #211 2048 0xD53C, // 피, #169 2049 0xD544, // 필, #295 2050 0xD551, // 핑, #376 2051 0xD558, // 하, #7 2052 0xD559, // 학, #129 2053 0xD55C, // 한, #15 2054 0xD560, // 할, #144 2055 0xD568, // 함, #152 2056 0xD569, // 합, #123 2057 0xD56D, // 항, #268 2058 0xD574, // 해, #32 2059 0xD588, // 했, #180 2060 0xD589, // 행, #135 2061 0xD5A5, // 향, #345 2062 0xD5C8, // 허, #396 2063 0xD5D8, // 험, #316 2064 0xD5E4, // 헤, #474 2065 0xD604, // 현, #185 2066 0xD611, // 협, #315 2067 0xD615, // 형, #244 2068 0xD61C, // 혜, #428 2069 0xD638, // 호, #117 2070 0xD63C, // 혼, #358 2071 0xD648, // 홈, #330 2072 0xD64D, // 홍, #363 2073 0xD654, // 화, #63 2074 0xD655, // 확, #183 2075 0xD658, // 환, #224 2076 0xD65C, // 활, #277 2077 0xD669, // 황, #353 2078 0xD68C, // 회, #74 2079 0xD68D, // 획, #458 2080 0xD69F, // 횟, #409 2081 0xD6A8, // 효, #400 2082 0xD6C4, // 후, #176 2083 0xD6C8, // 훈, #486 2084 0xD734, // 휴, #365 2085 0xD754, // 흔, #480 2086 0xD76C, // 희, #334 2087 0xD788, // 히, #228 2088 0xD798, // 힘, #502 2089 }; 2090 // the percentage of the sample covered by the above characters 2091 static const float frequent_ko_coverage=0.948157021464184; 2092 2093