コンテンツへスキップ

日本語三部作 < 自分の日本語

『自分の日本語』

これから日本語のことはスプレッドシートで考えませんか?

webjapanese books の日本語三部作は、日本語を俯瞰で眺めた『ニホンゴ ~外から見た日本語~』、日本語が使える最小限の日本語知識を考えた Minimum Japanese そして、三部作の最後の本であるこの『自分の日本語』は、日本語を全部デジタルでリスト化したので、これをアレコレいじってみませんか?という本です。

 

どんな本?

大人が使う日本語の語彙はだいたい2万~5万前後と言われています。これをリストにすると3MB以下、スマホの高画質の写真よりも小さいです。つまり、今は、自分の語彙をリストにしてスマホで持ち歩くことができます。

書籍では、スプレッドシートを使ったことが無い人のために、基本から使い方をしっかりと解説します。練習用シートで練習したら、付属の日本語圏で流通している日本語の表現をほぼすべてをリストアップしたデジタルデータで遊んでください。今後、日本語のことを考えたり、勉強したり、教えたりする時は、スプレッドシートでやりましょう、というご提案でもあります。この1冊で、AI時代に必要なデジタルデータの最も効率的な扱い方と、基本データを一気に手に入れることができます。

  1. 日本語ネイティブだけでなく、日本語を外国語として勉強したり、研究したりしている、日本語を使うすべての方のために作られた本です。
  2. エクセルなど表計算ソフト(スプレッドシート)には触ったことが無いという方も、日本語のデータをイジるだけなら難しくありません。(計算はまったく出てきません)0からしっかり解説します。
  3. 付属の日本語リストは、語は32000、句が約2000、構文と決まり文句が、それぞれ1500づつくらいあります。デジタルデータなので、自由に削除、修正、追加などカスタマイズできます。
  4. 約4万行のデータは合計3MB以下です。今、平均的なスマホやパソコンなら、簡単にスクロールして見ることができます。自分の日本語の全てを気軽に持ち歩いて、町中で知った語を追加してください。
  5. データ(スプレッドシート)を見るソフト(Google スプレッドシート、エクセルなど)は、今、パソコンでもスマホでも無料で手に入ります。
  6. リストはβ版の間はアップデートしつづけます。2025年末までに多言語版を出す予定です。

この本は、日本語の教科書でも日本語のことについて書かれた本でもなく、とにかく日本語を全部みてみようという本です。

何が出来るようになる?

基本的なスプレッドシートの使い方だけ覚えて、付属の自分の日本語リストをダウンロードして、とにかく、いろいろとイジってみて下さい。そして…

  • 使われる頻度、難易度、品詞、などで並び替えたり
  • 「~っぷり」で終わる語だけ、みたいな好きなやり方で一覧にしたり
  • メモ欄に、自分なりの解釈や使い方を追加で書き込んだり
  • 自分が知ってる語や表現、うっすら知ってる、知らないみたいな基準で分類を作ってみたり
  • 死語、死にかけの語、復活した語、みたいな、オリジナルの分類方法でウーンと考えてみたり。
  • AIサービスを使って、ドリルや教材を作ってみたり

といろいろ日本語で遊んでください。そして、自分の日本語リストにするために、スマホで持ち歩いて、街やメディアや人から新しい表現を追加していってください。

お買い求めは

 

→ 電子書籍版 1680円 → 出版記念!2025年9月末日まで半額の840円です。

Amazon(日)で買う

◇ 海外在住の方は、アメリカ | イギリス| ドイツ| フランス | スペイン | イタリア | オランダ | カナダ | ブラジル | メキシコ | インド | オーストラリアのアマゾンのストアで買うことができます。

👉 電子書籍は専用ハードがなくても携帯やタブレット、PC上で、アマゾン提供の無料のアプリで読めます。詳しくはアマゾンのヘルプをご覧ください。

印刷版 準備中(遅くとも、10月中には発売できると思います)
→ 印刷版 準備中

Amazon(日)で買う

アメリカ | イギリス | ドイツ | フランス | スペイン | イタリア | オランダ | ポーランド | スウェーデン | カナダ | オーストラリア | のストアで買うことができます。

電子はもちろん、印刷版も日本国内と同じ価格、送料、配達日で購入できます。海外在住の方へのプレゼントにもどうぞ。

👉 電子書籍は専用ハードがなくても携帯やタブレット、PC上で、アマゾン提供の無料のアプリで読めます。詳しくはアマゾンのヘルプをご覧ください。

多言語版 2025年内に出版予定です。予定している言語は以下のとおりです。

→ (現在製作中でモロモロ未定ですが、おそらく…)内容は日本語学習に特化した簡易版となり、各言語版のリストとともにデジタルデータとして、安めの価格で販売することを検討しています。日本語に興味を持った人に、最初から日本語のすべてのデータを提供するという画期的な本になると思います(こういう形が語学学習のスタンダードになるのではと思ってます)。もちろん、AIを使って自分で学習するベースになることを意識した試みです。

以下、出版順ではありません。

العربية
简体中文
繁體中文
ENGLISH
FILIPINO
FRANÇAIS
DEUTSCH
ʻŌLELO HAWAIʻI
हिन्दी
BAHASA INDONESIA
ITALIANO
日本語
BASA JAWA
ລາວພາ
한국어
BAHASA MELAYU
МОНГОЛ
မြန်မာ
नेपाली
PORTUGUÊS
РУССКИЙ
සිංහල
ESPAÑOL
தமிழ்
ไทย
TÜRKÇE
TIẾNG VIỆT

👉 翻訳は、AIなど自動翻訳になる予定です。

 

著者紹介

webjapanese編集部 & 荒牧 浩太

文責はwebjapanese編集部の荒牧浩太です。1993年より関東を中心に日本語教師として活動、同時に、1997年から、webjapanese.comという日本語学習者のためのウェブサイトを制作しています。90年代から、CGI、Flash、HTML5などを使った漢字クイズなど、さまざまなオンライン日本語学習コンテンツを作成してきました。2010年からは webjapanese books の代表者として、主に言語学や日本語教育の本の企画、編集の仕事をしています。

今後、この『自分の日本語』の特設サイト内で、自分の日本語リストのブラッシュアップと、リストとAIを利用した日本語学習コンテンツに挑戦していこうと思っています。

 

中身を覗いてみよう
ここをクリックすると目次が出てきます。もう一度クリックで閉じます

目次

0章

01 表計算ソフトの種類と違い
02 Googleアカウントを作る
 Googleドライブの初期設定
03 練習用リストを開くまでの2つの方法
 Step 1  辿りつく Step 2 データを使う2つの方法
04 使いこなしのための5つの基本キーワード
 1 シート 2 行と列 3 セル 4 フィルハンドル 5 関数(かんすう)
05 セルと列と行の基本動作
 セルに関する動作
06 基本的なファイル形式
 スプレッドシート周辺のファイル形式 テキストデータの話
07 最後に

1章 リストをみる

01 保険としてのバックアップと履歴機能
 履歴機能を頭の隅に置こう
02 ソート:並び替えてみましょう
 列の項目でソートする 複数の列の項目をかけあわせてソートする 範囲のランダム化
03 フィルタ:検索で並び替える
 基本的な使い方 条件でフィルタをかける 値でフィルタリングをかける フィルタを複数の列で使って絞り込む
04 順番を永久に変える
 シンプルに順番を永久に変える 行の順番を元に戻す リストの順番がおかしくなった?
05 検索と置換の活用と応用
06 Google スプレッドシートの外へ
 コピペでペースト エクスポートする 印刷する
07 その他
 シート全体をコピー 背景色と文字色を変える 列や行を非表示に フォントを変える 読み上げ ポートフォリオ的に使ってもらう ハンディキャップを持つ方々 共有 スプレッドシートのヘルプはGeminiで

2章 データを追加する

01 手作業で追加
 書いて追加する&削除する 行を追加する 列を追加する 重複チェックという課題 自分の日本語リストの重複チェックの自動化
02 コピペで追加する
 文字単位のコピペ 行単位のコピペ スプレッドシートじゃないものからコピペ 紙の本もスプレッドシートに取り込める
03 インポートで追加
 インポートする
04 その他
 日常生活で気になった語や文を追加 PDFをスプレッドシートに変換してインポート テキスト以外の入力 メモとコメント プルダウンの活用 チェックボックス 空欄をどうするか

3章 自分の分類を作る

01 自分の連番(通し番号)を作る
 「自分の連番」にするために
02 自分なりの分類を作るコツ
 分類の項目を埋めるためにソートやフィルタを活用する あらたな分類を作るなら優先すべきは語や表現の外見よりも内面 大は小を兼ねる
03 自分の分類で列を作ってみよう
 プルダウンメニューで作る 未記入の行を埋める作業 既存の列をコピーして作る
04 いろいろな応用
 自分の日本語の知識レベルの整理で使う 日本語教育方面で便利な分類 分類=カテゴライズは難しい?

4章 自動化する

01 関数の理解
 基本の理解 翻訳関数で理解する 【注意】生成した値はコピペで確定させたほうがいい 一旦設定した関数は… APIの仕組みと、その利用の手順
02 自分の日本語リストの関数の例
 翻訳関数 ひらがなカタカナ変換 重複のチェック
03 その他の関数
 タイムスタンプ その他いろいろ AIで関数を探してみた
04 関数ではない自動化
 アドオン Google Apps Script(GAS) AI関数的なもの

5 章 AI活用の可能性

01 AIの基本知識
 AIサービスの優劣 著作権と個人情報保護 サービスの種類と料金体系 AI系のAPI経由の料金の試算
02 自分の日本語リストとAI
 プロンプトの工夫はなくても大丈夫 スレッドでどんな形で答えさせるかを微調整する スプレッドシートとAIサービスとのコピペのコツ 日本語の難易度の仕分けはAIは得意ではなさそう AIの余計なお世話 Google スプレッドシートとGeminiの融合
03 日本語方面の基本的なポテンシャル
 品詞の判断の例 例文を作らせる ふりがな 語をAIで収集&追加 設問を作る 説明させる 文章を書かせる 拡張子 学習者自身の活用
04 応用と今後の可能性
 スプレッドシートとAIの融合 オリジナル日本語教材の作成 Google Apps Script(GAS)の活用 今後の進化に対する期待

6 章 自分の日本語リストについて

01 自分の日本語特設サポートサイトについて
02 リストの概要
 リストの種類 リストの見出し語の数 リストの順番 リストの「重さ」 リストのバージョン どうやって選んだのか? どうやって分類したのか? 見出し語と表記について 頻度について AIはどの程度使ったのか
03 語と句のリスト
 品詞 分類項目 使用例と例文 語や句のテーマ別リスト
04 文のリスト
 文表現のリスト AIへの補足 文語彙のリスト 文のリストを元にAIに指示する際
05 漢字のリスト
06 使い方のコツ
 ストレス無く使えるのは3万語前後? 辞書にはしないほうがいいかも… デフォルトの連番は残しておいたほうがいいかも… 時々メンテナンスしよう 画像や動画の管理は… 例文で使った語 このジャンルの語や表現が少ない!と思ったら

 

本編からちょっとだけ…

🗨 フィルタ機能でできること

「次を含むテキスト」で例えば「気」を使う熟語だけを出せますし「次で終わるテキスト」では、「的な」で終わる形容詞などをピックアップできます。ラップで韻を踏む語を探すのにも便利です。

フィルタはデータの「外見」を分けるのは得意ですが、意味のような「中身」で分けるのは基本できません。ただ、英語訳の列で「go」などの単語でフィルタをかけて、ある程度似たような意味の語を抽出することもできます。分類次第で可能性は出てきます。

文のリストでも「だけ」とか「はず」「V(masu)」みたいな語でフィルタをかければ、特定の構文(文型)だけを取り出すことができます。



🗨 ポートフォリオ的な活用

語学教育の関係者の方は、語学学習を自分で管理するための、ポートフォリオの活用ということをご存じだと思います。ポートフォリオは、病院のカルテのようなもので、自分の学習の状況を記録するものです。CEFRの文脈では「できることの管理」という形式ですが、自分の日本語リストは、語と文(文型)の言語知識の学習理解度の管理として使えます。

個人的には、日本語学習ではCan-do的なポートフォリオよりも、デジタル時代は、言語知識を軸にしたポートフォリオのほうが適していると思います。この自分の日本語リストのように、言語のすべてのリスト化が可能になり、一覧性が飛躍的に上がったので、言語知識的なポートフォリオの可能性も広がったと言えます。クラウド共有などの発展性もあります。



🗨 どうやって重複をチェックするか

2章の1節の「重複チェック」では、重複チェックの考え方を中心に整理しました。ここでは、関数を使って自動的にチェックする具体的な方法を紹介します。API利用ではなく、Google スプレッドシートで完結するタイプのシンプルな関数です。

このリストでは、Googleスプレッドシートで可能な2種類のチェック機能を使っています・どちらも「COUNTIF」という呪文を使います。count は英語で「数えろ」で、IFは、関数でよく使われるもので、「もし」こういう場合は数えろという意味になり、その右にその条件が続きます。



🗨 AIはどこまで文法用語を理解してくれるか

カッコは、masu 部分が省略されますよ、という意味です。「行きます」なら「行き」までです。例えば「行きたいです」みたいな形はこの「行き」だけを使っていますし、「飲みやすい」はこの動詞のV(masu)にやすいを付けて形容詞に変化するみたいな結合例があります。

この他、カッコは、そこが省略されるという意味ですから例えば、Vna(i) 動詞の「ない形」だと、「食べない」なら「食べな」までになります。

  1. V(nai)+ねばならない は「行か+ねばならない」
  2. Vna(i)+くてもいい は 「行かな+くてもいい」

1は「ない」が不要。「2」は「い」だけ不要という意味でカッコ~

 

自分の日本語リストとAIで出来ること

日本語を研究する人、学習する人、教える人、ただ遊んでみたい人、「自分の日本語リスト」で、いろんなことができます。

ツッコミフレーズから会話例と英語の説明

「らしい」の使い方をネパール語で

オリジナルの分類を作って、いろいろやる(ショート動画)

スマホで新しい語を追加する(ショート動画)

 

書籍内で使ったいろんな画像

 

 

特設サイトと付属の自分の日本語リストについて

 

『自分の日本語』特設サイト

https://webjapanese.com/nihongo/

特設サイトには、本編の出現順に、実際の動かし方のショート動画での解説があります。文字の説明だけでは分からなかったことも、これでバッチリ!?

自分の日本語リストと、練習用ファイルがあります。要IDとパスワードは書籍内にあります。

IDもパスワードも毎年変わります。このパスセットの有効期限は、購入した年の翌年の年末までです。2025で始まるパスセットは2026年の年末までとなります。パスワードは書籍の購入者のみが使えます。第三者に教えることはできません。

👉 自分の日本語リストは、90年代からFileMakereProで作り続けていた語や文のデータをベースが出発点です。コツコツ追加したり、サボったりを繰り返し、2022年から出版を目指して本格的に再開。語(単語)が約32000。句(熟語)が2000弱、文(構文)と文語彙(あいさつや決まり文句など)がそれぞれ1200前後です。今後、リストはアップデートしていく予定です。

 

【重要】自分の日本語リストの利用に関する制限事項

私どもは、今後、日本語学習に関するものは、基本デジタルデータで提供していく予定です。本格的なデジタル時代を迎え、きちんとデジタルコンテンツの権利を主張していくことは、後に続くクリエーターのためにも重要だと考えています。違法な利用の可能性についてご存知の方のための匿名の通報フォームもございます。著作権の侵害、及び、それを推奨すると思われる行為、発言には、悪意のある無しに関わらず、しっかり対応していく1予定です。

自分の日本語リストを利用してAIなどで生成したものは、個人の利用の範囲であれば自由に使うことができます。教育機関においても、正式に教材として採用し購入いただいたのであれば、人数分の購入をしていただければ、授業で使うこともできます。

きちんと利用の範囲を明示し、活用しやすくしたいと考えています。より詳しい説明は特設サイトにありますが、予防的に禁止事項の概要だけを書きますと…

  1. 自分の日本語リストは、Googleドライブ上でのみ使うことができます。
  2. Googleドライブ上では、統合されたGeminiの活用はできますが、アドオンなどGoogle以外のサービスの連携は、ファイルの情報の保護が確実ではありませんので利用できません。
  3. 自分の日本語リストのファイル、もしくは、これを元に改変したものを、ご自身のGoogleのアカウントのGoogleドライブ上以外の場所(AIなどすべての外部サービス)にアップロードすることはできません。
  4. ネット上の公開、自分以外の人との共有はできません。
  5. メールや記憶媒体などを使って第三者に譲渡、送信、できません。

ただし、書籍内でご案内しているように、リストから、行単位でコピーして使うことはできます。コピペの上限は一度に300行までです。例えば、文や語から例文を生成したり、説明をしてもらって、それをシートに転載するなどの作業は、十分にできると思います。こうやって作ったものの利用は個人の利用の範囲内において自由です。

個人、組織や団体などでの利用(+クラウド上での共有)、リストを元に制作したいわゆる二次的著作物のライセンス

  1. 自分の日本語リストの個人の利用:自分の日本語リストは、リストそのものだけではなく、自分の日本語リストを元に情報を追加したり修正して作ったリスト(スプレッドシート)も、『自分の日本語』の購入者もしくはリストの購入者である個人が、個人の楽しみ、学習、研究のために、所有するPC、タブレット、スマートホンなどのデバイスでの利用に限定されます。第三者との共有、複製、ネットを介して送信すること(翻訳やAI系サービスにファイルをアップロードすることを含む)はできません。
  2. 自分の日本語リストの組織、団体での利用:学校その他の組織において授業で利用する場合、その教育機関で採用している教材と同じ扱いになります。利用する方々すべて(教務の方々や学習者の方々)の購入が必要です。自分の日本語リスト及びリストをカスタマイズしたものを元にしてGeminiで生成した二次的著作物の組織内での配付、利用は可能です。利用できるAIはGoogle スプレッドシートに統合されたGeminiだけであること、利用は組織内だけであることに注意してください。リスト、及びカスタマイズしたリストを組織内でウェブなどを通じて、例えばクラウド上で教員または教務側と学習者側で共有して活用することはできません。が、利用者全員の購入と組織名の私どものサイト上の公開、定期的なフィードバックなど、私どもとのお約束を条件に、試験的に可能な場合があります。詳しくは、書籍及びリストの著作権に関してをご覧ください。
  3. 自分の日本語リストを元にした二次的著作物の一般向けの公開、配付(商用利用を含む)利用のライセンス:自分の日本語リストを元に、ウェブ上のサービスやアプリなどの二次的な著作物を製作し、個人の利用の範囲を越えて、あるいは上記の組織団体での利用を超えて、第三者の利用を前提に公開、配付、送信、共有すること、商用利用は私どもの許諾が必要です。このサイトのフォームからご連絡ください。また、現在、このライセンス利用に関しては、独占的な利用を前提に進行中の件がありますので、そちらが優先される可能性があることをご了承ください。

👉 より詳しいご説明は特設サイトをご覧ください。

 

参考文献・資料

主に自分の日本語リストに関して参考にさせていただいた文献や資料です。感謝申しあげます。

クリックで開閉します

語について

国立国語研究所のデータ

1)教育基本語彙データベース・日本語教育基本語彙データベース

2009年 
https://mmsrv.ninjal.ac.jp/brfvep/

「7種の教育基本語彙(阪本教育基本語彙、新阪本教育基本語彙、田中教育基本語彙、池原教育基本語彙、児言研教育基本語彙、中央教育基本語彙、国語研教育基本語彙)を表形式に一覧したもの。」

3種類あります。主に参照したのは教育基本語彙データベース(2009年版A) です。教育基本語彙データベース(2009年版B)と日本語教育基本語彙データベースは、重複をチェックして必要ならば追加した程度です。
ライセンスはCC BY http://creativecommons.org/licenses/by/4.0/deed.ja

2)複合動詞レキシコン|日本語複合動詞辞典

https://repository.ninjal.ac.jp/records/2000261

□ 学校系の語彙リストは以下を参考にしました。

1)小学校教科書語彙リスト
https://nihongo-de.com/shogakugoi
科学研究費基盤研究(C)21K00635(2021年〜2023年度 研究代表者:山本裕子)

「このリストは、小学校教科書の全教科・全学年の複合語相当表現を含む語彙網羅的に収集した語彙リストです。」

2)語彙リスト|松下言語学習ラボ
http://www17408ui.sakura.ne.jp/tatsum/

氏のサイトの他、以下の動画も大変参考になりました。

講義「どうすれば語彙学習負担を減らせるかーコーパスとテストから考える語彙の学習と教育ー 」(松下達彦)/言語学レクチャーシリーズVol.25
https://www.youtube.com/watch?v=wwIt_5iDVh8

語彙の研究にはどんなものがあるかは、以下の目録が参考になりました。

「語彙研究文献語別目録」データ https://mmsrv.ninjal.ac.jp/gobetsumokuroku/

日本語上級文型の意味分類 高瀬 利恵子
中日本自動車短期大学論叢 2014年
https://nakanihon.ac.jp/wp-content/themes/nac/doc/college/ronso/nac_ronso_044-04.pdf

初級日本語教科書共通語彙リスト ダウンロード | 留学生日本語教育センター | 組織 | 東京外国語大学 https://www.tufs.ac.jp/institutions/jlc/download.html

文について

また、初級以降の文型の漏れのチェックとして以下も参考にさせていただきました。

■ 初級日本語教科書共通語彙リスト 東京外国語大学 https://www.tufs.ac.jp/institutions/jlc/download.html

■ 日本語上級文型の意味分類
https://nakanihon.ac.jp/wp-content/themes/nac/doc/college/ronso/nac_ronso_044-04.pdf

漢字

いずれも文化庁の漢字に関する資料をベースにしました。

文化庁の常用漢字表
https://www.bunka.go.jp/kokugo_nihongo/sisaku/joho/joho/kijun/naikaku/pdf/joyokanjihyo_20101130.pdf

同、表外漢字字体表
https://www.bunka.go.jp/kokugo_nihongo/sisaku/joho/joho/kijun/sanko/hyogai/index.html

人名漢字
https://www.bunka.go.jp/seisaku/bunkashingikai/sokai/sokai_5/39/gijishidai/shiryo_6.html

です。漢字の配列は文科省が公開している「学年別漢字配当表」の学年別の学習順を利用しています。

漢字が使われる頻度順もあります。これは以下を参考にしています。

漢字出現頻度表
https://www.bunka.go.jp/seisaku/bunkashingikai/sokai/sokai_7/45/pdf/besshi_1.pdf

その他のリソース

小学校社会科教科書における語彙の分析
https://hokkyodai.repo.nii.ac.jp/record/3918/files/42-2-1C-01.pdf

👉 これらの他にも、数多くの文献、資料、論文を参考にさせていただきました。特設サイトでは、もうちょっと深掘りして書いていく予定です。

ネット上のリソース、書籍、動画、テレビなど

2022~2025年の3月にかけて、定期的にTverやYoutube、ポッドキャストなどを再生し、「今日は副詞だけをメモする」というような作業を繰り返し行っていました。あまり偏らないように、30以下の動画に絞り、時にランダムに見るということにしていました。後半は、未習語を拾うというテーマに移行しました。話し言葉は、上にあげたコーパスや研究で作られたリストではなかなかカバーできない部分です。

以下は、ほんの一部です。ありがとうございます!

沈黙の金曜日 :2020年以降、ポッドキャストで配信されているすべての放送分。

ぼる塾チャンネル – YouTube https://www.youtube.com/@borujuku

official令和ロマン【公式】 – YouTube https://www.youtube.com/@official-reiwaroman

Charan Po Rantan official – YouTube https://www.youtube.com/channel/UC0gOWBkEuF4EF3XAi-iA-nQ

福留光帆 公式チャンネル- YouTube https://www.youtube.com/@FukutomeMitsuho

ういちゃんねる – YouTube https://www.youtube.com/@user-xu9zi3gh5p

オトナ語の謎』 監修 糸井重里 編者 ほぼ日刊イトイ新聞 2003年刊


  1. 私どもは、1997年からサイトを自ら製作、運用し、デジタル関係とその著作権には多少詳しいほうだと思います。発信者情報開示請求で開示まで至った経験もあります。[]