全領域
4bit×4bit×4bitで4096

逆に基本音節領域は…?

  • 母音8通り
  • 子音15通り
  • ショートカット7通り
    840

4096から引いて3256になる。
3256の略語を入れられるね!

ちなみにステノワードは、14bitで16384通りのうち、3336レコード。
12bit分しかつかってない。20%です。

とはいえ、20%しか使わないかと言うとそうではなくて、
50%くらいの稼働でもいいかなと思う。
1208の略語。
十分おおい。
まず、コア400くらいから実装したい。


  • 記号とか出せるようにする?
    • - ,###みたいなやつを一発で出せるようにする?
  • 4キー全押しは特殊な操作を割り当てたい。
    • 上のMarkdownショートカットを入れておけばいいかも

全押し721通り

15x15x15の領域

全押し以外の略語の考え方

  • ショートカットキー単体領域
    • 8通り
    • 6個うくつんっーを実装済み
  • 母音入力無しのときの、子音とショートカットの組み合わせ。
    • 各子音に対して15個の略語を割り当てられるという意味にしていいと思う
    • 子音14通り、ショートカット15通りで210通り。
      • 子音押してない時、全押しを除いて
    • 子音だけ押したときの挙動も含む。
  • 母音の略語領域に対するショートカットとの組み合わせ。
    • (子音を押してないとき)
    • 母音キーの母音が割り当てられてない略語領域が6通りある。
      • 押してない時、全押しを除いて
    • 90通り。
    • 「あいうえおやゆよ」に対する64領域もある。
  • 各子音に対する略語領域

むずい…
活用…?
日本語の活用型

品詞って何がある?
話し言葉コーパスの解析

品詞出現確率備考
助詞29.12%活用しない。1文字が多く設計が難しい。
助動詞12.64%活用する。えぐい。
動詞10.71%活用する。
形容詞2.94%活用する。
感動詞10.52%活用しない。比較的取り掛かりやすい。
形状詞1.16%わからん。
接続詞0.77%少なくて出現率高い?
接頭辞0.56%
接尾辞1.73%
代名詞3.88%少なくて出現率高い
副詞5.93%
連体詞0.80%
名詞17.35%エグい。
形態論情報付与対象外0.24%以下その他
言いよどみ1.61%
伏せ字0.02%
0.01%
喃語0.01%

KaraSの略語設計 TOP500

入れたい略語(頻度順?)

「ない」がわからなすぎる。
助動詞の「ない」と形容詞の「ない」がある?
助動詞の「だ」の連用形「で」と助詞の「で」

助詞

「取捨選択が難しい」

  1. って
  2. から
  3. けれど
  4. くらい
  5. じゃん
  6. だけ
  7. もの
  8. まで
  9. たり
  10. しか
  11. より
  12. なんか
  13. ながら
  14. なんて
  15. やん
  16. ばかり

「は」みたいなやつは、普通に基本音節の「は」を打ったほうが早そう。
というか助詞の「は」は出現確率が1.5%ほどあって、その分基本音節の「は」が入力しやすいところを割り当てている。
逆に言うと、略語で「は」を実装するのであれば、基本音節のは行の重みを減らしたほうがいいかなと思う。(は行の重みを減らしたい。助詞の「は」を減らすと、は行の重みは、が行やざ行と同じレベルになる)

助動詞

「思ったよりかんたんかもしれない。嘘かもしれない。」
形容詞とか動詞とかにくっつく?助動詞ってなに?

  • てる
  • です
  • ない
  • ます
  • ちゃう
  • つう
  • れる
  • たい
  • とく
  • てく
  • られる
  • らしい
  • せる
  • とる
  • へん
  • させる
  • てらっしゃる
  • べし

「だ」の活用型?
「です」「ます」

助動詞をうまいこと実装すると、だ行をかなり減らすことができる。

動詞

「絞れば、かんたんに実装できそう。副詞・助動詞のほうがむずい。」

  1. 言う
  2. する
  3. ある?
  4. いく
  5. やる
  6. 思う
  7. なる
  8. くる
  9. いる
  10. わかる
  11. みる
  12. ちがう
  13. たべる
  14. でる
  15. はいる
  16. もらう
  17. とる
  18. つかう
  19. もつ
  20. しる
  21. いれる
  22. もらう
  23. とる
  24. 使う
  25. 持つ
  26. 知る
  27. 入れる
  28. 書く

4文字以上の動詞

  • 下さる
  • 考える
  • 頂く
  • 覚える
  • 頑張る
  • 忘れる
  • 教える
  • 喋る
  • 無くなる
  • 始める
  • 要する
  • 調べる
  • 働く
  • 疲れる
  • 感ずる
  • 始まる
  • 関する
  • いらっしゃる
  • 間違える
  • 聞こえる
  • 集まる
  • 対する
  • 合わせる
  • 繋がる
  • 続ける
  • 思い出す
  • 亡くなる
  • 生まれる
  • 喜ぶ

しぼるのが大変だ…

形状詞

「初めて知った品詞なので理解が足りない」

  • みたい
    • みたいな
  • そんな
    • あんな
    • どんな
    • こんな
  • よう
  • そう
  • すき
  • 確か
  • 大変
  • まじ
  • きれい
  • 大事
  • 同じ
  • 以外
  • 可哀想
  • 簡単
  • 完全
  • 懸命
  • 上手
  • 素敵
  • 可能
  • さすが
  • 当たり前
  • 残念
  • 微妙

基本的に「な」「に」がつくやつ?

みたい、よう、そう
の3つは助動詞語幹というジャンルらしい?
みたいだ、ようだ、そうだ
ってなるってこと???

「たり」(や「と」)とくっつく形状詞は「たり形状詞」と言われているみたいだけど、
頻度的に少ないので今回は無視する。満々たり、漠然たり、黙々たりなど。

形容詞

  1. ない
  2. よい
  3. すごい
  4. おいしい
  5. おおい
  6. おもしろい
  7. たかい
  8. はやい
  9. やばい
  10. うまい
  11. わるい
  12. おおきい
  13. かわいい
  14. ちいさい
  15. ほしい
  16. やすい
  17. むずかしい
  18. いたい
  19. ながい
  20. たのしい
  21. つよい
  22. すくない
  23. ちかい
  24. わかい
  25. おかしい
  26. あまに
  27. あたらしい
  28. いそがしい
  29. さむい
  30. あつい
  31. でかい
  32. あぶない
  33. えらい
  34. うれしい

接尾辞・接頭辞 (未)

「名詞とセットで実装する可能性が高い」

  • お(御)
  • さん
    • さま
    • くん
    • ちゃん
  • たち
  • てき
  • つ(たぶん、こいつそいつのつ)
  • にん(?)
  • こ(助数詞)

連体詞

  • こそあど
    • この
    • こんな
  • おなじ
  • いろんな
  • ある
  • たいした
  • おおきな
  • いわゆる
  • ちいさな
  • ほんの
  • たんなる(5383位)

代名詞

一番やりやすい。

  • なに
  • こそあど
    • これ
    • ここ
    • こちら
    • あそこ
    • こいつ
  • 一人称
    • わたし
    • おれ
    • ぼく
    • われわれ
  • だれ
  • いつ
  • 二人称
    • おまえ
    • あなた
    • きみ
  • 三人称
    • かれ
    • かのじょ
  • いずれ

感動詞

「高頻度な割に、短い単語が多くて難しい」

  • かんたんに出せるやつ
    • うん
    • あっ
    • ふん
    • えー
    • おー
  • ああ、
  • えーと、
  • ほら
  • はぁ
  • あれ?
  • んー?
  • ありがとう
  • あら
  • うわ
  • ほう
  • うんと
    • んと
  • わあ
  • おい
  • さあ
  • こんにちわ
  • まあ
  • こら
  • クソ
  • さようなら
  • あざっす

副詞

「副詞もわからない…形容詞と動詞にくっつく?」

  1. そう
  2. もう
  3. まあ
  4. ちょっと
  5. こう
  6. どう
  7. やはり
  8. 多分
  9. 結構
  10. 全然
  11. 未だ
  12. 成る程
  13. 余り
  14. 良く
  15. 一番
  16. ちゃんと
  17. ずっと
  18. 色々
  19. 一杯
  20. 目茶
  21. 例えば
  22. もっと
  23. 直ぐ
  24. どうぞ
  25. 先ず
  26. 若し
  27. 取り敢えず
  28. 急度
  29. 丁度
  30. 勿論
  31. ああ
  32. 中々
  33. 少し
  34. どんどん
  35. 初めて
  36. 元々

接続詞

  1. ただ
  2. しかも
  3. そして
  4. また
  5. けれど
  6. から
  7. たら
  8. あるいは
  9. もしくは
  10. さらに
  11. しかし
  12. さて
  13. ただし
  14. かつ
  15. および
  16. すなわち
  17. いっぽう
  18. もっとも
    コーパスに乗ってるのはこれで全てだった。
    1000のラインは、またが917位

定型文章

「なんでもいい」

  • いつもお世話になっております。
  • ありがとうございます。
  • よろしくお願いいたします。

名詞

エグい。
数詞(数字)は実装しない。

固有名詞

基本的な固有名詞だけ実装して、後はユーザー領域にしたほうが良さそう。

  • 日本
  • 東京
  • 大阪
  • 京都
  • 北海道
  • 沖縄
  • 横浜
  • 新宿
  • 中国
  • アメリカ
  • ディズニー
    ディズニー外すと全部地名にできる。外したいw

助数詞

多いし、頻度が高いし、文字は短い。

時間系

  1. 時間

  2. 箇月

  3. 年間

  4. 月(つき)

  5. 通り

  6. キロ

  7. 週間

  8. ページ

  9. センチ

  10. メートル


文字数に着目してみる?

感動詞除く

1文字
正直実装しなくてもいい。他の語句と組み合わせて実装するか、子音の重みの調整で実装する。
ショートカットで1ストロークで出せるものも実装しなくてもいいかな。
「きょう」とかは3文字だけど1ストローク

2文字
頻出する動詞や副詞があり、活用などで一気に実装しないといけない部分がある。

重要語句

  • てる
  • って
  • です
  • なに
  • いう※
  • ない※
  • よい
  • それ
  • ある
  • ます
  • もう※
  • これ
    などなど…
    ※1ストロークで出せるけど活用したり活用させたりするもの。

3文字・4文字
鬼門。上位1500までに813の単語がある。

5文字以上
ショートカットによるアドはでかいが、頻度は少ない。
TOP1500までの5文字(数詞除く)

  1. 大丈夫
  2. 考える
  3. 面白い
  4. 結局
  5. 此の間
  6. 難しい
  7. 取り敢えず
  8. トウキョウ
  9. 授業
  10. 勉強
  11. 研究
  12. 新しい
  13. 忙しい
  14. 週間
  15. 女の子
  16. 中国
  17. 中学
  18. 病院
  19. 可哀想
  20. 状態
  21. 情報
  22. いらっしゃる
  23. 紹介
  24. 間違える
  25. 練習
  26. 素晴らしい
  27. 両方
  28. 状況
  29. 最終
  30. ホッカイドウ
  31. 教室
  32. 温かい
  33. 一生
  34. 物凄い
  35. てらっしゃる
  36. 教育
  37. 思い出す
  38. ディズニー
  39. 当たり前
  40. 小学
  41. マンション
  42. 申し訳
  43. シンジュク
  44. 卒業
  45. 営業
  46. 牛乳
  47. 社長
  48. 片付ける
  49. 目茶苦茶
  50. 此方側
  51. 発表
  52. 頂戴
  53. タイミング
  54. 誕生
  55. パーセント
  56. 懐かしい
  57. 男の子
  58. 珍しい
  59. 有り難い
  60. 焼酎
  61. 仰る
  62. 順番
  63. 合宿
  64. 入院
  65. 来週
  66. 十分
  67. 駐車
  68. 教員
  69. 仕方無い
  70. 兄弟
  71. 若干
  72. アンケート
  73. 赤ちゃん
  74. 一瞬
  75. 会場
  76. 了解
  77. スケジュール
  78. 夏休み
  79. 恥ずかしい
  80. 申し込む
  81. 瞬間
  82. エレベーター
  83. しょっちゅう
  84. 商品
  85. 柔らかい
  86. 彼方此方
  87. 調整
  88. フィリピン