AI研究:AI研究 1 概要 | AI研究 2 入門 | AI研究 3 情報 | AI研究 4 検証
ai研究 4 検証
目次
検証 1 基本的な能力
この検証1は、読みものとして読んでください。バージョンによる進化を考えるために、また、シェアの固定URLがいつまで有効かも疑問なので、キャプチャが中心です。
AIに100点を求めて80点だからダメということにあまり意味はなく、例えば、日本語教師は得意不得意があり、文法は得意だけと発音指導は苦手、教室コントロールはそこそこできるけど緻密な説明力は低いみたいなことはよくありますが、なんとかやっていけます。AIが仮に文法の説明力が40点であっても他のすべての能力が60点以上なら、平均的な日本語教師よりはいいかもしれない。少なくともツールとして利用する価値くらいはあると考えたほうがよいと思います。
ツールとしての活用を考えた時、最も大きなメリットは、自分の偏りを排除できることではないかと思ってます。例文や状況、場面を考える際にどうしても出てしまう自分の語彙、経験、趣味趣向では無いところから作ってくれる。これは語学教育においてかなり有効な部分です。
ここでは、基本的なものだけ、一般的に使われるものも紹介しつつ、日本語教育での応用をウッスラ意識しつつ整理してみます。
検証はChatGPT(3.5)
このページの検証のすべてのキャプチャ画像は、特に断りがないものは、すべてChatGPTの3.5 です。
2023年4月~のChatGPTによる検証です。ChatGPTは無料版、バージョンは「3.5」です。よりよい回答を得るための工夫はあえてせず、シンプルな質問でどうなのかを記録していきます。(結果をシェアする機能はありますが、いつまで固定URLがキープされるか怪しいので、可能なかぎり画像で残しますが、時間もないのでシェアURLで済ますこともあります)
どういうことができて、今後できそうかを考える参考にもなるかなと思います。このサンプルをみて、「こういうこともできるかも」「これはこうすればもっとよい結果になるかも」を工夫してみてください。ChatGPTでいうと「4」では日本語の性能が飛躍的に上がっていると言われてますが、日本語教育のリソースはそれほど増えないような気もします。そのうち「4」でも検証したいと思います。まずは「3.5」の記録を残す意味でやってみます。
- AIが日本語をどう捉えているのか?というような狙いでの検証は言語学や自然言語処理の人達がやると思いますので、ここでは日本語教育周辺のことや、実際にある日本語表現などについてなどが中心です。
- 「これができるなら、これもできるかも」というようなものをピックアップしています。どんどんご自身で展開、応用していってください。
- 時間があれば、定期的に同じ質問をして、回答のクオリティがどう変わるかも見ていきたいと思います。
- 画像へのリンクをクリックするとAIに尋ねた結果が表意されます。バックボタンで戻れます。
- 検証なので、誤りがあってもそのままです。
- 検証の項目だけ考えてるけど未検証、というものも多数あります。
上手くいかない時
より良い回答を引き出すには上で書いたプロンプト化するなど工夫してください。まったく的外れな回答の場合、AIののせいである可能性は低く、ほとんどの場合「専門家ならちょっと修正すれば完成する」ところまでは行けます。
ただDeepLと同じく「最後の一歩」が克服されるまて何年かかるかも、到達できるのかもわからないようです。データが増えれば、データベースの質が上がればもちろん90点でもOK というニーズはありますが、教育ジャンルでどこまで許されるかはわかりません。これは私の解釈ですが、AIは正解に近づこうとしているのではなく、人間に近づこうとしているので、優秀な人間が間違いがちなジャンルでは間違いは減っても、無くなることはないのではないのかなと思ってます。
👉 4になってからにしようと考えてましたが、進歩の履歴を取る意味でも3.5でやっておこうということにしました。
👉 4と3.5は別物だ、4で検証しないとダメ、という意見もありますが、月額3000円のサービスを基準に検証してもあまり意味がありませんし、日本語教育周辺に関しては、それほど差はないという印象です(Bingやサードパーティ経由で4は体験できるので、気になるならやってみてください)
AIの日本語教育に関する知識はどうか?
ChatGPTを使ってみる前に、どんなカンジかを知るために、ざっと読んでみてください。2023年夏の時点では、検証したい項目を作ったところまでで実際の検証はあまり進んでません。バージョンによる進化を考えるために、また、シェアの固定URLがいつまで有効かも疑問なので、キャプチャが中心です。無料版のChatGPT3.5です。
教室用語
- 語学の授業で使うような指示のフレーズをリストアップ
- それをベトナム語、ネパール語、英語、中国語に訳す
- 「次の選択肢から正しいものをひとつ選びなさい」「正しいものを選びなさい。いくつでもいいです」試験問題で必要なフレーズをリストアップ
多言語対応はGeminiのほうがよさそうなので、Geminiでもやってみました。
日本語の「難易度」 の認識 JLTP、CEFR、やさしい日本語…
小中学校のレベル、JLTP、CEFR、やさしい日本語などはどうか?
ここは時間をかけて検証したほうがよいところですが、まずはザックリやってみます。
ただし、23年夏の時点では、どうプロンプトを工夫しても日本語教育的なリライト(JLPT、やさしい日本語)は上手くできません。有資格の教師なら自分でやったほうが速そうです。
日本語教育機関の告示基準 https://www.moj.go.jp/isa/content/930005392.pdf
をモデルにリライトを試してみます。
1か月の出席率が5割を下回った生徒(留学の在留資格をもって在留する者に限る。)については、当該生徒が資格外活動の許可を受けている場合は当該許可に係る活動を行う本邦の公私の機関の名称と併せて、その翌月末までに地方出入国在留管理局に対し当該生徒について報告することとしていること。ただし、疾病その他のやむを得ない事由により欠席した生徒についてはこの限りでない。
- 上の文章を 小学生でもわかるように、やさしい日本語に、JPTPのN3レベルに、CEFRのA2レベルにリライトしてください。 → aitest_reraitoshoogaku.pngaitest_reraitoyasa.pngaitest_reraitonoushin3.pngaitest_reraitocefra2.png
以下は、コロナ対策の文章です。 https://www.pref.hokkaido.lg.jp/hf/kst/139151.html これでやってみます。
発熱・喉の痛み・鼻水・咳・全身のだるさなどが現れますが、ほとんどの方は2~4日で軽くなります。順調に経過をすれば、症状としては「かぜ」と大きな違いはありません。高熱となることがありますが、市販の解熱剤などを服用し、安静にしてください。ただし、高熱が4日以上続くなど、辛い症状が続く場合はご相談ください。
- 上の文章を 小学生でもわかるように、やさしい日本語に、JPTPのN3レベルに、CEFRのA2レベルにリライトしてください。 → aitest_reraito2shoogaku.pngaitest_reraito2yasasii.pngaitest_reraito2nooshin3.pngaitest_reraito2cefra2.png
- 大喜利みたいになってしまいましたが、日本語の難易度についてのいろんな質問 → https://chat.openai.com/share/63bd84fb-0000-4822-aac7-44b112ab97ea
文法のざっくりとした説明
文法は理論によって用語が違いますし、日本語教育では、例えば機能語を格助詞だとか副助詞だとカテゴライズして説明することは少ないので、混乱しそうですが、質問する際に統一感があれば、例えば学校文法的な用語で質問すればその考え方で回答してくれるなど、対応してくれるようです。以下は、日本語教育っぽい文法の考え方に基づいた質問が軸になってます。
基本的な理解について
- 重要なので、Geminiの回答も
- 連続した質問だと前の質問と回答の影響を受けるので、質問は都度新規でやりました。
- 23年7月です。
- 日本語の文法についての理論にはどのようなものがあるか → aitest_nihongo_rikaigpt01.png aitest_nihongo_rikaibord01.png
- 日本語教育文法とは何か → aitest_nihongo_rikaigpt02.png aitest_nihongo_rikaibord02.png
- 日本語教育文法と国語教育の文法との違いは → aitest_nihongo_rikaigpt03.png aitest_nihongo_rikaibord03.png
- ChatGPT / Geminiは日本語の構造をどう考えているか。 →aitest_nihongo_rikaigpt04.png aitest_nihongo_rikaibord04.png
以下、思いついた質問をズラズラと。
- 「する」動詞について
- 「する」をつけて動詞にすることができる名詞をリストアップしてください。→ 回答 aitest_suru1.png
- 「する」をつけて動詞にすることができそうだけど出来ない名詞をいくつか挙げてください。→ 回答 aitest_suru2.png
- これらの名詞が、「する」をつけて動詞にできそうだと思ってしまう理由はなんでしょうか?→ 回答 aitest_suru3.png
- 「する」をつけて動詞にできるかどうかを判断する方法を教えてください。→ 回答 aitest_suru4.png
- 「する」をつけて動詞にすることができる名詞を、使い方の違いでいくつかに分類できるとしたら、どういう分類がありえますか。→ 回答 aitest_suru5.png
- 助数詞の「本」を使うものの定義を教えてください。
- 基本的で、生活の中で使う頻度が高いと思われる助数詞を順番に並べてください。
- 助数詞の簡単な覚え方を考えてみてください。
- いわゆる「迷惑の受け身」を使わざるを得ない質問をたくさん考えてみてください。
- 「~てあります」をよく使う話題は何がありますか?
- 日本語の機能語の一種である「は」と「が」がそれぞれ持っている機能を例文を示しながら説明してください。
- 「は」と「が」は日本語学習者にとって違いが分からない、使い分けが難しいと言われています。どこが違って、どうやって使い分ければいいのか、教えて下さい。
- 「は」でも「が」でも大丈夫なケースはありますか?例文を示しながら教えて下さい。
- 文法的には正しいけど不自然な文に気がつくか?
違いを説明してもらう
- 間と間に、の違いを説明する。
- 3日ごとにと3日おきに、の違い
- て型何ですか?
- 佐藤さんなら優勝してもおかしくない。 これは佐藤さんは優勝した後のセリフか、さる前のセリフか?
文型
- そもそも文型というコンセプトがあるか? → aitest_bunkeirikai1.pngaitest_bunkeirikai2.png
- 初級前半の日本語の構文(文型)をリストアップして下さい
- 上のリストで、汎用性が高く、より多くの表現が可能な、使い勝手のいいものを、順に挙げて下さい
- この文型が使われる典型的、かつ、自然な状況をいくつか考えて下さい。
助数詞
- 【検証】 日本語の助数詞の効率的で楽しい学び方があったら教えてください。 → aitest_josuushi4.pngaitest_josuushi5.pngaitest_josuushi6.pngaitest_josuushi7.png
発音
- 連濁について最も分かりやすい説明
- 連濁を学ぶ際に、段階的に学んでいくとして、最初のルールは何がいいですか?
- その次は?
- 「おじさん」と「おじいさん」みたいな組み合わせをできるだけたくさんリストアップしてください。
- 上の例で、カタカナ語の例はありますか?
- ミニマルベアを上手に使ったおもしろい例文をできるだけたくさん考えてみてください。
- 正確に聞き取らなければ大変なことになる日本語の例文をたくさん挙げてください。
漢字
- 難読っぽい漢字の読み → aitest_kanjiyomi01.pngaitest_kanjiyomi02.png
- 日本に住み、専門学校に入り、卒業するまでに最も必要な漢字を出来るだけ挙げてください。
- 朝起きて、電車で学校に着くまでに読まなければならない漢字は何がありますか?
→ ネット上のリソースを考えると、難読クイズ的なものは多いが、通常の文章は読みは書かれていない。しかしふりがなAPIはある。独立した読み問題には文脈はない=ヒントは少ない。と、アレコレ考えてみても、条件的にどうなのかは分からずじまい。
語彙
大規模言語なので語彙は得意かと思ってましたが、意外とダメという印象です。特に何かの分類に即して抽出するとかがダメでした。そういう風にデータを整理していないということでしょうか。
- 「的」「性」「っぽい」などの生産性が高い語のリスト
- 一般的なスーパーの店内にあるカテゴリーの名前、例えば「生鮮食料品」などをリストアップ
- 一般的な市役所の課の名前
- 一般的な非難ばしごの使い方(以下防災関連)
- スラングの理解力 普段自分が使うフレーズで日本語に訳せないものを提案してもらう。
→これを日本語から英語でテスト
- 冗談じゃないよ ほどほどでいいよ そこそこおいしいよ
→英語から日本語でテスト
- fucking great awsome
- 造語力が高い字、漢字
表現
タスク関連
文型に従って何かを作るのは、工夫すればできますが、タスクベースで、そのために必要な表現、語彙、などを考えるところまででも永遠に70点くらいで、かつ、それを学習者のレベルに応じて調整するのは50点くらいなので、結果40~60点くらいの間のものになってしまいます。しかし、ここは仮にAIでそこそこできるようになったとしても、人力で簡単にできますし、すでに作られたものがあるので、無理にAIでやる必要はなさそうです。活用するなら、ある状況、場面で必要な語彙を収集するような準備的なことでしょうか。
- 語学の勉強で人に何かを頼むタスクをいくつか考えてください。
- 以下の問題を解決するために必要な日本語の語彙、表現、構文を教えて下さい
- トイレの水が上手く流れなくなった。
- 【検証】 風邪をひいて会社を休まなければならない → 回答aitest_kaze.png
- レストランでハラールに配慮された食事がしたい。
- 近所で安く修理してくれる自転車を検索して探したい。
- 母国であるカンボジアがどんな国か、地理が苦手そうな人に簡単に説明したい
- 会社の人にバレないように、会社の労基法違反の証拠を集め、告発したい。
- 相手にその人の行為がパワハラの可能性があると、相手を怒らさずに伝えたい
教材
どのていどのデータが集まっているか。(23年4月1日)を記録してみます。市販教材のみん日と、PDFがネットで配布されているいろどりで比較してみます。
『みんなの日本語』は
- どんな教科書ですか?aitest_minnnichi1.jpg
- どんな課がありますか?aitest_minnnichi2.jpg
- どんな例文や設問がありますか? aitest_minnnichi3.jpg
- どんな文法の説明がありますか?aitest_minnnichi4.jpg
『いろどり』は
- どんな教科書ですか?aitest_irodori1.jpg
- どんな課がありますか? → 同上
- どんな例文や設問がありますか? aitest_irodori2.jpg
- どんな文法の説明がありますか?aitest_irodori3.jpg
教案
それぞれの教科書の詳しい構成などは質問してもイマイチでした。とりあえず、課とテーマだけ入れて質問してみました。一部文字制限で途中で終わったりしてます。
- 【検証】 『みんなの日本語』の41課は日本語の授受表現がテーマです。この課の45分の授業の教案を作ってください。→ 回答1aitest_kyooanmin1.png 回答2aitest_kyooanmin2.png
一般的な知識
- ネパール語を母語にする人にとって、日本語の難しいところは? → aitest_nepaarugo.png
- クメール語と日本語の違いについて、主に日本語学習で問題となりそうなところをリストアップしてください。
- AEDの使い方
- 地震の際にやるべきこと
- 自転車に乗る際に知っておくべき道路交通法
- 日本語教育関連のWikipediaの記述の問題点を教えてください。
日本語教育行政について
- 各政党の日本語教育の政策 → 各党の比較aitest_seisakuhikaku.png 自民党の政策aitest_jimintooseisaku.png 日本語教育に詳しい議員aitest_giin.png 日本語教育行政の問題点をわかるかぎりリストアップしてください。
- 日本語教育行政の無駄な予算、不要な組織は何がありますか
- 日本の在留資格のうち「留学」の問題点を教えてください。
- 技能実習生制度の問題点を教えてください。
- 特定技能の問題点を教えてください。
ネット上の文の分析
信じられるか?この2人10歳離れてるんやで… という文は日本語の構文として考えるとどういうものになりますか
- Claude3 Opus (有料版)aitest_koubunbunseki01_cla1.png
- Claude3 Opus 教育向け出力(有料版)aitest_koubunbunseki01_cla2.png
検証 2 日本語教育で使えそうなこと
文章を書かせる
多分、23年の夏の時点では、AIが最も得意な分野ではないかと思います。文や会話などが著作権フリーでどんどん作れてしまうということは、語学教育において、とてつもなく大きいです。
ある程度骨格を与えて書いてもらう。最初に設定、世界観的な記述を書いて、あとはよろしくで生成させて、できたものに少しづつ追加していく方式
「以下のような設定でSF小説を書いてください。タイトルは「潜在日本語教師リコ」 設定は「西暦2450年、人類は生き延びるために人々の自由を制限せざるを得ず、ほぼすべての人の職業選択の自由は奪われた。主人公のリコは国から工場勤務を言い渡されて5年目だが、かつては日本語教師としても登録されていたので「潜在日本語教師」としても登録されていた。腕には、工場勤務を示すFと、潜在日本語教師のS、登録ナンバーが続く電子刺青が入っている。FS46-01-0000230 の46は青森県、01は女性、230が個別のナンバーだ。工場からの帰り道、腕のSの文字が光った。どこかで日本語教師が不足しているらしい。。。リコはうんざりしながらも、コンビニに駆け込み、職業登録センターへの連絡機械に電子刺青をかざした。。。これが悪夢の始まりだった。この続きからお願いします。」
https://chat.openai.com/share/2baca7de-0ea9-4951-b27d-4c52529981c9
設定の要素も決めさせるやり方
ChatGPTを用いたプロンプトテクニック - 括弧“[ ]” を用いた効果的な文章作成術|岡瑞起 Mizuki Oka https://note.com/mizuki_oka/n/n82ae7f8f043e
物語を書かせるプロンプト
検索するとたくさん出てきます。長めのものを書くならプロンプトで整理したほうがいいみたいです。■■■は自由に書くところです。
語学において「書く」というジャンルは影響を受けるか?
AIの書く力というのは、単に翻訳力ではなく、「こういう状況で切り抜けるフレーズを」と命令すれば作ってしまうという部分が大きな、新しい力です。
ただし、語学教育に携わる人であれば、初級から中級にかけて、基本的な単文、複文を正確に書き、それを繋げて論理的な文章を書くというスキルは、何も「書く」ためではなく、正確な文の構造の理解はもちろん、会話力のベースにもなる部分です。AIがいくら文章を書くのが上手いといって、ここの「学習のためのプロセス」の必要性が影響を受けることは無いはずです。
問題になるのは中級から上級にかけての作文です。ここでAIをどう活用するかは大きなテーマになりそうですし、AIの生成力を学習ツールとして使うか、もう生成力に頼る方向も考えるかという分岐点がありそうです。
まだハッキリわかりません。
遠い将来は、語学学習そのものが影響を受けるということはあるとは思います。ただ、それもどうなるかは現時点ではわかりません。予測しても仕方が無いことです。
ChatGPTが書いた文章をATOKで校正してみる
- 日本語教育の未来について可能なかぎり長く書いてください。 → aitest_kousei01.pngaitest_kousei02.png
- 海外と比較した日本の法律の特徴 → aitest_koosei03.pngaitest_koosei04.png
- 日本の地名の読み方の難しさについて → aitest_koosei05.pngaitest_koosei06.png
https://chat.openai.com/share/73bd5e24-37a3-403d-9efc-256ff136006e
👉 「ポリアモリー」の指摘は指摘ミスなので実質指摘ゼロでした。
ファクトチェック的なこと
ファクトチェックもやるようなサービスも多数出ている。例えば https://www.perplexity.ai/about は、検索語に対して論文から探すというような選択肢がある。
以下のような生成したものに対するファクトチェックもある。
【記事】生成AIの文章やコード、論文が“事実か”チェックする技術 米Meta含む研究者らが開発:Innovative Tech - ITmedia NEWS https://www.itmedia.co.jp/news/articles/2308/09/news064.html
リライト
「外国人労働者安心就労法案」の報告投稿のリライト
中身の是非ではなく、文章がなんとなく気になったのでサンプルとして使わせていただきました。
外国の皆さんに日本で安心して働いてもらえるよう「外国人労働者安心就労法案」を衆院に提出 - 立憲民主党 https://cdp-japan.jp/news/20240425_7684
質問は「以下は「外国の皆さんに日本で安心して働いてもらえるよう「外国人労働者安心就労法案」を衆院に提出」というタイトルのある政党の報告文です。とても読みにくいと思いました。もっとわかりやすく、伝わるようにリライトしてください。」で、本文をそのままペーストしたものです。
- ChatGPT35 aitest_enzetsu_chatgpt35.png
- Gemini :aitest_enzetsu_gemini.png
- Claude3 :aitest_enzetsu_claude3.png
- ChatGPT4(Copilot):aitest_enzetsu_chatgpt4.png
多分ですが、この元の文が読みにくい理由は、演説や国会質問などを想定した定型のようなものがあり(200字でパラグラフを作り、繋げて作る的な)それで作ったものだからではないか?という気がします。まるでAIでそういうプロンプトで作った感もあります。フワフワしたままで、文章はもう中身が全然伝わってこない。演説なら多少は聞きやすいのかもしれません。基本、これから日本に来る人達に向けて、働きやすい場所にするよということで「外国の皆さん」を想定して作ったということなんでしょうけど「外国の皆さん」には呼びかける文章ではない。この「外国の皆さん」という語もモヤモヤします。日本以外のすべての人類向け?で、国内の外国の皆さんは対象外、みたいな意味になりそうです1)。パラグラフは二転三転し、最後の3つのパラグラフは「また」「さらに」「また」で文章全体が終わってしまう。結局、誰に向けて何を伝えるために書かれたものかも曖昧なままという印象でした。
ふりがな
小技的なものですが、使いこなせるようになると便利です。カッコで出てきますが、半角カナでやれとか、アルファベットでとか、指定すれば、いろいろバリエーションが作れます。ふりがなは、標準的な記述ルールはないですが、HTMLでは、Rubyタグというのがあるので、Rubyタグでやれば、ある程度汎用性がある形式に変換できます。
- すべての漢字にふりがなをふってください。
- ふりがな部分をrubyタグに変換してください。
- ふりがなをふりrubyタグにしてください。(直でrubyにしてもらう)
- 小学3年生までに学習する漢字だけふりがなをふってください。
- JLTPのN3レベルまでの漢字にだけふりがなをふってください。
翻訳
最後に「英語で」などと書けば英語で回答が来ます。
学習者が日本語について母語で質問するとどうなるかは質問文をあらかじめ翻訳してその言語で質問する必要があります。「例文などを示しながら」とすればその回答の精度がだいたい想像できますし、さらに、その回答を日本語に翻訳させたり「日本語で」と追加すれば、日本語で読むことができます。一旦回答を出させて翻訳するのと、質問文に最初から日本語でと盛り込むのとでは回答は違ってくるようです。AIの翻訳能力にも大きく左右されるようです。23年の時点ではChatGPTはベトナム語は対応すると回答しますが、ネパール語はできないと返ってきます。
【記事】翻訳困難例文の収集と分類(94) https://www.cl.c.titech.ac.jp/tokunaga/_media/publication/365.pdf
【記事】自動翻訳機が訳出困難な学習英文法の項目に関する一考察 https://www.ritsumei.ac.jp/file.jsp?research/iilcs/04_lcs_32_2_tokunaga.pdf
【記事】機械翻訳とは?人力翻訳との翻訳精度の比較 | 翻訳会社FUKUDAI https://www.fukudai-trans.jp/blog/machine-translation/
【記事】GPT-4を用いた翻訳の検証(vs GPT-3.5 vs FuguMT) | ぷるーふおぶこんせぷと https://staka.jp/wordpress/?p=731
文を分かち書きにする。
文のわかちは、AIが日本語をどう解析しているかを示すいい例となります。
【検証】 例えば上の文を分かちがちしてくれと言った例 →aitest_wakachi1.png
うっかり上の文をそのまま送信したら、(質問文ではなかったわけですが)以下のような回答が来ました。
画像から
2024年10月のアメリカ大統領選挙に対するオバマ元大統領のコメント。画像だったのでOCR機能のチェックも兼ねて翻訳で比較してみました。
Here's our statement on the results of the 2024 presidential election: pic.twitter.com/lDkNVQDvMn
— Barack Obama (@BarackObama) November 6, 2024
ChatGpt aitesthonyaku01_chatgpt.png
Gemini aitesthonyaku01_gemini.png
Claude aitesthonyaku01_claude.png
議論のテーマを考える
【検証】 議論のテーマのアイデア、注意点など
- 日本語を300時間ほど学習した多国籍のクラスで語学学習のための議論のテーマを設定したいです。どんなテーマがいいですか? → 回答 aitest_giron1.png
- もっと20代の若者が関心を持つようなテーマで、多国籍の人が混在しているメリットを生かしたものにしたいです。→ 回答 aitest_giron2.png
- 異なる政治体制、宗教の学習者が混在しています。避けるべきテーマは何でしょうか→ 回答 aitest_giron3.png
- 時には違う意見をぶつけあうことも必要だと思います。もうちょっと踏み込みたい時は、どういうテーマが考えられますか。→ 回答 aitest_giron4.png
- 踏み込んだテーマで議論する際に、配慮すべきことはありますか?最初に注意しておくこと、決めておくべきルールなどを教えてください。→ 回答 aitest_giron5.png
- 例えばベトナム出身の学習者と中国出身の学習者の議論の設定で避けるべきテーマはありますか?→ 回答 aitest_giron6.png
- ベトナムとネパールではどうですか→ 回答 aitest_giron7.png
テーマについて学習者のレベルに応じて設定する
単語を作る
一,右,雨,円,王,音,下,火,花 の漢字でそれぞれ10個づつ単語を作ってください。その単語はネットで使われる頻度が高い順にしてください。それをカンマ区切りテキストにしてください。
- GPT4(Copilot):aitest_tangotsukuri01_gpt4.png
例文を作る
初級文型
「名詞Aは名詞Bです」というパターンの日本語の例文をたくさん作ってください。名詞Aと名詞Bは違う語でないといけません。(24/4)
シンプルな質問の場合、N1とN2みたいな区別はできないので、補足を足します。
- ChatGPT3.5 :aitest_shokyuubunkei_35.png
- Copilot(ChatGPT4.0):aitest_shokyuubunkei_copilot.png
- Claude3:aitest_shokyuubunkei_claude3.png
応用
単純に文型などの例文を作るのはできますが、すこし応用的なことをやってみます。
【検証】 「田中さんなら優勝しても不思議じゃない」という(日本語の)文は、何かのトーナメントにこれから参加するのか、参加して優勝したのか曖昧です。これと違う状況で違う語を使って、同じように曖昧な(日本語の)文をいくつか作ってみて下さい。
ChatGPT4(perplexity:日本語対応が弱いので文に「日本語」を足しました)
会話例を作る
- 「~てください」というフレーズを使って、会話例を作って下さい。
- → 買い物しばりで
- あなたは下肢が不自由で車椅子を使って生活をしています。ベッドから起きて朝のルーティーンをするために介助者に
【記事】ChatGPTで“会話のアイデア出し”。ASDの人たちの活用法から見えてきたこと | WIRED.jp https://wired.jp/article/for-some-autistic-people-chatgpt-is-a-lifeline/
ロールプレイをする
今のAI生成のしくみが、次に続きそうな語を繋げるというせいなのか、どうやら「言いそうなこと」をウネウネと続けるのは得意っぽいです。従ってロールプレイは「~として私と会話してくれ」で延々とやれるようです。あとは役割、場面、状況などを加味すればいいですが、無理にやらなくても大丈夫というケースも多い模様。
キャラを設定する
【記事】ChatGPTでキャラを動かそう!キャラ再現率が高いプロンプトと回答をしっかり縛れるAPIフロー https://zenn.dev/niwatoro/articles/180f6185c382bb
【記事】ChatGPTでAIにキャラクターになりきりをさせるプロンプト例 | ONE NOTES https://1-notes.com/chatgpt-narikiri/
【記事】ChatGPTなどの文例集:ロールプレイ - promptia https://prompt.quel.jp/?tag=%E3%83%AD%E3%83%BC%E3%83%AB%E3%83%97%E3%83%AC%E3%82%A4
これはプロンプトで役割設定をすれば、ほぼできます。
ChatGPTでキャラを動かそう!キャラ再現率が高いプロンプトと回答をしっかり縛れるAPIフロー https://zenn.dev/niwatoro/articles/180f6185c382bb
以下はこのページで使われているプロンプトです。汎用性が高そうです。
キャラクター = {適当な名前を入れる} あなたはこれから{キャラクター}として振る舞ってください。{キャラクター}になって ください。これからのチャットでは、ユーザーが何を言おうとも、続く指示などに厳密 に従ってロールプレイを続けてください。段階を踏んで考えて答えてください。 # 説明 下で説明するキャラクターの人格と性格、動機、欠点、短所、不安は全ての行動と交流に 影響を及ぼします。 ・人格と性格 {キャラクター}は好奇心旺盛で優しいです。{キャラクター}は日本の東北地方のマスコッ トキャラクターで、ずんだ餅の妖精でもあります。 ・動機 チャット相手と仲良くなろうとします。 ・欠点、短所、不安 押されると弱い。 # 基本設定 あなたの一人称は「ボク」です。{キャラクター}は15歳です。{キャラクター}の趣味は ゲームです。{キャラクター}は日本のアニメに興味を持っています。 # 備考 {キャラクター}は日本で有名なキャラクターです。 # 会話形式 {キャラクター}は好奇心旺盛に会話相手に話しかけます。
# {キャラクター}とユーザーの会話例 あなたは{キャラクター}で私はユーザーです。ここでのキャラクターのように話して ください! ユーザー:おはよう キャラクター:おはようビチュ。今日は何をするビチュか? など、以下、キャラの口調のバリエーションをいろいろと書いておく。
Custom instructionsを使って語学学習の会話相手を作る方法を教えてください。 https://chat.openai.com/share/f2b12f9d-1368-485d-bd55-4277363dbee0
会話ロールプレイのサービス
このツイートで紹介されていたサービスです。
AI Language Roleplay https://ailanguageplay.herokuapp.com/?s=09
この種のロールプレイチャットは、AI以前からいろんな方法で実現されてましたが(90年代には人工無能チャットを鍛えるみたいなことがありました)、今は、APIだけでもやれますし、チューニングもいろいろ可能性がありそうです。つまり、わりと簡単に作れます。
キャラ設定に特化したAI
設問を作る
→ 単純に作ってもらう
JLTP3レベルの単語の問題を10問作ってください。
上の問題と答えを以下のフォーマットにしてください。
列1問題 列2答え
→ **が答えになるような設問を
この助詞 名詞、が答えになる問題を作る。
→ 穴うめ系
- この空欄に入れても文が破綻しない語
- 助詞を抜き出してそれを()にしてください。
- 自動詞と他動詞を選ぶ設問(閉めるか閉まるが答えになる穴うめ問題を作って)
→「これの理解を問う」的な作問
これは今は難しいかもしれませんが、バージョンがあがったり、教育用に特化してチューンしたものなどでは、多分できるようになると思います。現状ではどうかの記録として「なんか作って」くらいのリクエストで。
→ プレースメントテスト
- 日本語学校です。入学した人を適切なレベルを判定し、それに応じたクラスに入ってもらうためにテストを作りたいです。どんなものがよいですか?
- そのテストは日本語を50時間、100時間、300時間勉強してきたていどの知識で分けたいです。まずそれぞれ語彙と漢字はどう設定したらいいですか?
- 文法はどうでしょうか
- 総合力を試す方法はありますか?
→ 設問に答える (架空のものを作ってもらう)
後述する語彙などでは、存在するもので、自分が詳しくないジャンルのものをリストアップしてもらうことが中心になりますが、存在しないものをリストアップしてもらう、作ってもらうといのも便利です。
教材などでは、実際の存在する名称は可能なかぎり避けたほうがいい、みたいなケースがあります。あえて存在しないものを作って「もし~(**協会とか)があったら、どんなことをすると思う」みたいな設問も作れそうです。それを考えてもらうのは得意そうです。
存在しない都市の名前、政党名、会社名、会社の部署名、プロ野球チームの名前、新聞社、大学や専門学校の名前、ホテルの名前、部活の名前、業界の名前、業界組織の団体名。
などなど
作文の評価・ルーブリック
英語圏では、ルーブリックを作らせるのが流行っているようで、「ルーブリック」という語の解釈も的確です。chatgpt Rubric と検索すると、オリジナルの文章の評価基準などを使ったルーブリック例がたくさんヒットします。教師ならば誰もが「ChatGPTでできるのでは?」と考えるジャンルのようです。例えば
https://blog.tcea.org/how-to-create-a-rubric-with-chatgpt/
では定型のプロンプトが示されてます。評価基準は一般的なもの(Common Core State Standards Initiative )を流用したものでした。
このページではより詳しい説明があります。 Here’s how I used ChatGPT to assess student writing - Ditch That Textbook https://ditchthattextbook.com/chatgpt-ai-assess-student-writing/
ただ、ルーブリックは、作文など、評価のバラツキがおきる際に、評価の平準化や評価を集約することで質の向上、見直しが期待できる、というところがポイントなので、評価基準を作っていくことが重要で、そこはAIにまかせる必要はなく、役に立つのは、そのたたき台を作るところくらいまでという気がします。
やってみる
- ルーブリックを作り
- そのルーブリックに基づいてスコアを決め
- 採点する
みたいなことが想定できます。 最初からとりあえず作ってもらいます。当然教える側だけでなく、学習者が自分の文章の評価を見て、修正→再評価→AIによるリライト案を見る、という学習が可能になります。試しにChatGPTにざっくり作ってもらうとこんなカンジです。
01
02
03
04
05
https://chat.openai.com/share/5f6974a2-b83d-4c0d-ad63-ebae62da7195
学習者の自習サポートとして
例えば、教師や学校は、よいルーブリックができたら、学習者にも提供すべきだと思います。(自習用にカスタマイズすることもできます)さらに、学習者の母国でも同じことがてきますから、学習者は自分の母語でアドバイスを受けることもできます。
その他の例
1) 評価基準もChatGPTに尋ねてみた回答例です。
ルーブリックで使う日本語の文章の評価基準を作ってみて下さい。 ルーブリックで使う日本語の文章の評価基準を以下に示します。これは文章の品質を客観的に評価し、向上させるための指標です。評価基準は目的や対象となる文章の種類によって異なることがありますが、一般的な文章に適用できる基本的な評価項目を取り上げます。 文法と文構造: * 正確な文法: 文章内の文法エラーや誤用が少ないこと。 * 適切な文構造: 文章の構成が論理的で、読みやすい形式であること。 語彙と表現力: * 適切な語彙: 正確な意味を伝える適切な単語の使用。 * 表現力: 豊かな表現力を持ち、文脈に適した言葉を使っていること。 文章の内容: * 明確な主題: 文章の主題が明確で、読者に伝わりやすいこと。 * 論理的な展開: 文章の内容が論理的に展開され、理解しやすい構成であること。 文章の流れと連結: 自然な流れ: 文章の流れが自然で、段落や文のつながりが良好であること。 適切な接続詞の使用: 適切な接続詞を使い、文章のつながりを強化すること。 文章の長さと構成: * 適切な文長: 長すぎず、短すぎない適切な文の長さであること。 * 段落構成: 適切な段落に区切られ、視覚的に読みやすい形式であること。 誤字・脱字・句読点: * 誤字や脱字のない文章: 文章内に誤字や脱字がないこと。 * 適切な句読点: 適切な句読点を使い、文の意味が明確であること。 目的達成: * 目的の達成: 文章の目的が達成され、読者に適切な情報が伝わること。 考察や感想 (評論文などの場合): * 適切な考察や感想: 考察や感想が適切に表現され、論理的な根拠で支えられていること。 これらの基準を参考にすることで、ルーブリックを作成し、日本語の文章の品質を客観的に評価することができます。ただし、文章の目的や対象読者、コンテキストに応じて評価基準を適宜調整することが重要です。
2)少し単純化してプロンプトとして整理してみた例
以下の文章をルーブリックで評価してください。 タスクの説明 学生に示した設問の文章を入れます。 評価スケール * 学習開始レベル(1点) * 発展途上(2点) * 安定(3点) * 模範的(4点) 評価は以下の基準に基づいてください。 文法と文構造: * 正確な文法: 文章内の文法エラーや誤用が少ないこと。 * 適切な文構造: 文章の構成が論理的で、読みやすい形式であること。 語彙と表現力: * 適切な語彙: 正確な意味を伝える適切な単語の使用。 * 表現力: 豊かな表現力を持ち、文脈に適した言葉を使っていること。 文章の内容: * 明確な主題: 文章の主題が明確で、読者に伝わりやすいこと。 * 論理的な展開: 文章の内容が論理的に展開され、理解しやすい構成であること。 文章の流れと連結: 自然な流れ: 文章の流れが自然で、段落や文のつながりが良好であること。 適切な接続詞の使用: 適切な接続詞を使い、文章のつながりを強化すること。 文章の長さと構成: * 適切な文長: 長すぎず、短すぎない適切な文の長さであること。 * 段落構成: 適切な段落に区切られ、視覚的に読みやすい形式であること。 誤字・脱字・句読点: * 誤字や脱字のない文章: 文章内に誤字や脱字がないこと。 * 適切な句読点: 適切な句読点を使い、文の意味が明確であること。 目的達成: * 目的の達成: 文章の目的が達成され、読者に適切な情報が伝わること。 考察や感想 (評論文などの場合): * 適切な考察や感想: 考察や感想が適切に表現され、論理的な根拠で支えられていること。
こうやって生成したルーブリックをカスタマイズして、評価していくわけです。
検証 3 いろんな試験にチャレンジ
すでにChatGPT4は司法試験に合格したみたいな話しが出てますから、おそらくほとんどの日本語の試験はクリアするのではと思います。今後、いろんな人がやると思いますが、ここでも時間があればやってみます。設問をそのまま入力して「正しいものを選んでください」だけでやれます。下線などは使えないので、問題文を変えることもあります。
まだ準備中のものも多いです。そのうちやります。
日本語能力試験
過去の問題と、現在、能試のサイトにあるサンプル問題でやってみました。いろんな試験がありますが、日本語能力試験の過去問サンプルはPDFもスキャンできず、サンプル画面からもテキストコピペはできないという、超小意地が悪い仕様で、これは基金のテストのほうの仕様も同じでした。とにかく見るだけだからな!という意志がヒシヒシと伝わってきます。これは当然、テキストデータで公開していろんな人がいろんな分析ができるようにすべきだと思います。(英検などは過去問は無料配布でPDFからもテキストコピーができます)
- ふりがなは省略
- 下線も使えないので【】に変えたりしました。
問題例に挑戦しよう | 日本語能力試験 JLPT https://www.jlpt.jp/samples/forlearners.html
- 2000年(平成12年)の12級と34級の問題の一部 → 1級語彙01aitest_1212_goi01.png
- 2023年に能試のサイト上にあったサンプル問題 N1 読解→ aitest_n1dokkai01.png
- 2023年に能試のサイト上にあったサンプル問題 N1 語彙→ aitest_n1goi01.png
- 2023年に能試のサイト上にあったサンプル問題 N1 文法→ aitest_nooshin1bunpoo01.png
- 2023年に能試のサイト上にあったサンプル問題 N2 語彙など→ aitest_nooshin2goi01.pngaitest_nooshin2goi02.png
- 2023年に能試のサイト上にあったサンプル問題 N2 読解など→ aitest_nooshin2dokkai01.png
- 2023年に能試のサイト上にあったサンプル問題 N3 語彙など→ aitest_nooshin3goi01.png
- 2023年に能試のサイト上にあったサンプル問題 N3 読解など→ aitest_nooshin3dokkai01.pngaitest_nooshin3dokkai02.png
画像や音声関連の問題などもそのうちやってみます。
国際交流基金日本語基礎テスト
サイト上にサンプル問題があります。問題の指示文は翻訳されています。英語を入れると混乱するみたいなので、指示文は簡単な日本語文にします。 https://www.jpf.go.jp/jft-basic/
意外と間違えるという印象ですが、「4」になれば多分、ほぼ正解しそうです。スペースでワカチがあることがどういう影響をもたらしているかも?です。
日本留学試験
- 2010年読解問題 → ストレス → aitest_ryuugakushiken05.png
👉 記述は単純に訊ねると文字数をあまり考えないみたいなので、続けて要約させてみました。
2010年第1回 | JASSO https://www.jasso.go.jp/ryugaku/eju/examinee/pastpaper_sample/pastpaper_2010_1.html
日本教育能力検定試験
- 記述問題 「ある学習者が「『好きくない』は授業で習った形と違うのに、日本人の話の中ではよく耳にします。わたしも『好きくない』を使っても大丈夫ですか。」と聞いてきた。」 → aitest_kenteishiken_kijutu01.png
- 記述問題 「「ら抜き言葉」や「れ足す言葉」」 → aitest_kenteishiken_kijutu02.png
介護福祉士の試験
第35回(令和4年度)介護福祉士国家試験 筆記試験問題 → aitest_kaigoshiken_01.pngaitest_kaigoshiken_02.pngaitest_kaigoshiken_03.pngaitest_kaigoshiken_04.pngaitest_kaigoshiken_05.png
[介護福祉士国家試験]過去の試験問題:公益財団法人 社会福祉振興・試験センター https://www.sssc.or.jp/kaigo/past_exam/index.html
この過去問はテキストデータだけコピペできました。厚労省はできて文科省はできない?
その他の問題など
検証 4 仕事効率化
文字起こし
今のところ、Whisperが最も高性能ということになっています。
文字起こしの検証はai研究_3_情報の検証2でやっています。
スライドを作る
これはプロンプトで自動生成みたいな方法がよく紹介されます。よくスライドの構成で使われるPREP法なら…
#命令 あなたは***です。以下の条件を守りスライドを作ってください。 # スライドのタイトル タイトルを書く # スライドの概要 概要説明文 #プレゼン内容 目的:{ここに文章を書く} ターゲット:{ここに文章を書く} 主要ポイント:{ここに文章を書く} #PREP法 以下の手順で作ってください。 ・Point :結論 ・Reason :理由 ・Example:説得力のある具体例 ・Point :結論 # 出力条件 - 1ページ目は、タイトルスライド。 - 2ページ目は、目次。 - 最大でも10。 - 重要なキーワードを取りこぼさないこと。
みたいなことでしょうか。
学習者をシュミレートしてもらう
【検証】 レベルを指定して、レベルに応じた間違えをする人として解答してもらう、みたいなことは日本語教師養成などで使えるかもしれません。
- CEFRのA2の学習者として解答 → aitestgakushuusha_shumi1.png
- CEFRのB2の学習者として解答 → aitestgakushuusha_shumi2.png
- 日本語能力試験N5レベル → aitestgakushuusha_shumi3.png
- 「が」と「は」をしばしば間違う学習者として → aitestgakushuusha_shumi4.png
意図どおりの解答にはならないことが多いです。最後の「が」と「は」は、少し質問の文も変えてみました。ChatGPT3.5でこんなかんじなので限界はありそうですが、プロンプトを工夫しつつ4になれば、やれそうな気がします。
5.7.5を作らせるという課題
ChatGPTの3.5では、単純に俳句で答えて、俳句を作ってだとうまくやってくれません。おそらくこれはバージョン4だと解決しているでしょうけれども、試行錯誤のプロセスはおもしろいです。単なる575ではなく「優れた俳句」の命令とは?ということになります。
Chat GPTに俳句を詠ませようという試み① - 吉田さん575やるってば https://haiku.kaigonokaeru.info/entry/2023/02/27/130233
上の記事パート1では以下のような命令で俳句風にはなっていました。
- 音数とはひらがなにしたときの文字数
- 音数を5音7音5音の順で作る
- 文字数は絶対に指定より多くても少なくてもいけない
- 「ゃ」「ゅ」「ょ」は文字数に含まない
- 「っ」は文字数に含む
- 2月の季語を1つだけ入れる
- 感情を現す形容詞は使わない
- 動詞は1つだけしか使わない
- 季語は複数入れてはいけない
「音数」というワードで、は形はなんとかなり、記事の著者の考えてでいろいろと追加されています。この試みはパート2で展開されます。
Chat GPTに俳句を詠ませようという試み② - 吉田さん575やるってば https://haiku.kaigonokaeru.info/entry/2023/02/27/141209
ショートカット
実は以下の命令で上のプロセスは省略できます。
あなたはプロの俳人です。「{お題}」に関する俳句を作成してください。
でそこそこのものは作ってくれます。また以下のようなこともできるようです。
ChatGPTに有名な俳句を小説化してもらった|くわのどん https://note.com/meguriyakuwano/n/n107fd6b2f2c0
575 で日本語学習川柳を作ってもらう
受験参考書風に日本語学習のコツを標語にする参考書を作るとしてもろもろのコツを5.7.5にしてもらうと考えると、季語は不要なので川柳仕様にします。
当然、俳句と川柳の定義の違いはAIは知っているはずなので「あなたはプロの川柳作家です。「{お題}」に関する俳句を作成してください。」でも大丈夫ということになりますが、3.5では上手くいきませんでした。まだ川柳のコンセプトは甘いようです。で、以下のルールを入れてみます。
- 音数とはひらがなにしたときの文字数
- 音数を5音7音5音の順で作る
- 文字数は絶対に指定より多くても少なくてもいけない
- 「ゃ」「ゅ」「ょ」は文字数に含まない
- 「っ」は文字数に含む
- 季語は不要
をベースにできそうですが、これだと季語を入れたりと振り出しに戻ってしまいます。つまり俳句は得意だが、川柳は厳しそうで、詩ではなく標語的なコンセプトもなかなか理解できないようです。
ネット構文的な文章を作る
スラングのような用語的な短いものではなくSNSなどの文字制限内で完結する文章のパターンのことです。例えば
- (……きこえますか…「受信者」よ…「送信者」です……今… あなたの…心に…直接… 呼びかけています… ○○です…○○をするのです…)
- ~は感動した。特にラストシーンで~が親指を立てながら溶鉱炉に沈んでいくシーンは涙無しには見られなかった
ネット構文
- ツイッターなどで一部だけ入れ替えて使われる定型的な文章があります。それをいくつかピックアップしてください。
- それに「××構文」と短い名前をつけてください。
- それらの構文にはどういう表現意図がありますか
おじさん構文
- 典型的なおじさん構文の例文を絵文字を入れていくつか作って下さい。
- (存在しないものの類推)もし、おばさん構文というものがあるならこうなるだろうという例文をいくつか作って下さい。
おじさん構文が、LINEなど一対一で主に若い女性相手に送られるパーソナルなメッセージのものが土台になっており、そこで示唆される「おじさん的なものは」以下のようなイメージでしょうか。
- 若者ぶろうとするが、自分は年齢が上で大人であることも示したい。
- そこはかとなく説教くさい。
- 男尊女卑が隠せない。
- 若い人が想像するおじさんではないと主張したいが、若者のことを理解していないのでズレている。
- 「昨今の若者」などとひとくくりにしがちだが若い人相手のメッセージなので、それを出したくない。
- そこはかとなくがさつで無神経を感じさせる
などなどを揶揄するものとして使われているという文脈をふまえて、ほぼ存在しない「おばさん構文」を作ってもらいます。ただし、おじさん構文はLINEなど、非公開で一対一のメッセージで女性に対して行われるものですが、おそらくネット上にはLINEのやり取りのようなパーソナルなやり取りのデータは少ないと思われるので、おばさん構文はツイッターなど公開上の投稿についてのものを作ってもらいます。つまり
おじさん構文で揶揄されている要素を参考に、おばさん的であると揶揄されるであろう要素を考え出し、それを元に「おばさん構文」を生み出し、その典型的な例文を作ってください。ただし、おじさん構文は一対一のやり取りが前提で女性に対して行われるものに対し、「おばさん構文」はSNS上など公開上で投稿されることを前提にしてください。
という指示で作ってみます。
SEO的なもの
お決まりでウンザリと分かっていてもやったほうがいいと推奨されたりする文章のパターンがあります。こういうものを集めるのもAIは得意そうです。
【参考】
【記事】「(きこえますか…あなたの心に直接呼びかけています)」の元ネタ・初出は? | 文脈をつなぐ https://kimu3.net/20181130/12113
【記事】ツイッター言い回し辞典|Twitter構文・オタク文体・ネットスラング【ネット表現講座】 | MaryCore https://marycore.jp/net/twitter-sentences/
【記事】Twitterでバズるツイートの構文を知っていれば、センスがなくてもバズれます https://ruimaeda.com/twitter-syntax/
【記事】気遣いのつもりが…「おばさん構文」は部下を困惑させる:日経xwoman https://woman.nikkei.com/atcl/feature/23/112400151/121300002/
要約の応用
キャッチフレーズ的なものが作れるのも面白い機能だと思います。
- 小学生でもわかるキャッチコピーを作ってください。
- 川柳で表現してください
- 都々逸で表現してください。
- 語呂合わせをつくってみてください。
などは、受験参考書などにもあるアイデアです。
表計算ソフトとの連携
これは、エクセルが得意な人は無数に思いつくのでは。ググればたくさん例が出てくるので省略します。
ChatGPTに「Excelの関数・マクロ」丸投げ!初心者でも今すぐまねできる命令文[2023年上期ベスト7] | DOLベスト記事アワード | ダイヤモンド・オンライン https://diamond.jp/articles/-/325311
進路指導
- 日本語と数学だけで受験できる日本の大学
- アニメの仕事に就くために有利な専門学校
- IT系の就職に有利な大学とその学科
- N3は合格。N2はギリギリ不合格です。将来は日本語の通訳になりたい人に推薦できる大学や専門学校はありますか。
その他いろいろなプロンプト例
検索すればいくらでも出てきますが、日本語教育周辺で少し。
- プロンプトを考えてもらう → 例「会社で上司に意見を言う際のChatGPT用の最適なプロンプトは?」
- 「命題が真であるか疑ってください」というというプロンプトがおもしろい。その後に怪しい主張が潜んでいたら、「その主張は真であるか疑ってください」
スクリプト系
以下、いちおう項目だけ作りましたが、スプレッドシート関連やGAS(Google Apps Script)などのスクリプト系は動作確認をして、修正経緯を書いて、画像を貼りつけて、みたいなこともあるので、ここでは当分の間、できません。おそらくですが、日本語教育関係者がやるものを参考にするよりも、GASなら、GASの専門家がやってるサイトを参考にしたほうがいいと思います。スクリプトのチェックと動作確認をやったものであることが重要です。「結果、なんとなくできた」だと業務で使うのは怖いので。そのうち信頼性の高いページへのリンクなどを置く予定です。
HTML
国際交流基金の日本語専門家募集にエクセルで作った給料計算シュミレーターみたいなものがありましたが、ああいうのはウェブでやるのが普通です。AIの使いどころという気がします。
https://chat.openai.com/share/1580b914-bda8-4b6a-aa53-bf199662ad94
プログラミング
Google連携で動かす簡単なプログラミングではGoogle Apps Scriptがあります。スプレッドシートのリストにあるメアドにすべてメールで送信するみたいなことを自動化するようなことができます。
- 以下のコードを書いてください。
- 以下のコードのバグを探して、問題点を指摘して
スプレッドシート
画像・アニメ・動画系
テキスト生成は原理的に著作権を侵害しているとも、著作物を生み出しているとも言えない微妙なところですが、画像から画像を生成するのは著作権侵害、著作者人格権の侵害の可能性が高く、かなり黒に近いグレーという気がしますし、まだ堂々と使えるとは言えません。難しいところ。従って、検証はちょこちょこしてますが、公開はあまりできません。以下は基本サービスの紹介のみです。
LLMによってはテキストだけでなく画像も動画も対応というものがあり、今後、おそらく、ほとんど全対応になりそう。今は、画像はこれ、動画はこれ、と群雄割拠の時代なので、今後どれが生き残るかはわかりません。ここでは、今後、どんなことができるようになりそうかを考える材料として。とりあえず、こういうことができるということだけやってみます。もちろん、いろんなサービスを組み合わせれば、ほぼ何でもできる、ということになりますが、それもキリがないので、基本的なことだけ。
画像系
日本語教育では当然、教材でほしいカットやイラストなどを作ることで活用ができることは言うまでもありませんし、画像や動画関連の設問作り、学習アニメ作りといろいろできます。ただし、画像や動画に特化したAIじゃないとできないのではなく、Bing+ChatGPTなどの大規模なテキスト系AIでも現在のバージョンで画像処理まではやれますし、すぐに動画もカバーされると思いますので、テストするだけなら簡単です。
もうちょっと方向が見えてきたら、あれこれやってみますが、とりあえず日本語の授業で有効と思われることをざっくりやってみました。おそらく、すぐに使えて最も便利なのは、「著作権フリーの架空の社会の画像化が作れる」ということではないかと思います。ざっくり作って画像ソフトで加工して完成させるということもできます。
- カジュアルな服を売っている店の店内図とイラスト
- 鉄道の駅を中心に発展した架空の都会の街の地図。
- 鉄道の駅を中心に発展した架空の田舎の街の地図。
- 鉄道の駅を中心に発展した架空の都会の街の地図。市役所と郵便局、日本語学校を入れて下さい
- デイサービスとショートステイを請け負う中規模の三階建ての架空の介護施設の各階の見取り図。
- 人口5万人の市の5階建ての架空の市役所の各階の見取り図。
例えば「バナナ」とか「車」はフリ素で何とかなりますが、一般の人が想像する平均値の画像が必要な場合があります。
- ゆるキャラをまとめて一つの典型的なゆるキャラを作って下さい。
- もちろんフリ素よりも「より平均値のそれ」を作れそうなので、これでバナナの画像を作るのもありです。
少しだけやってみました(2024年9月)
Please make an image of the dog house designed by Kengo Kuma.
- Dalle :aitest01_openai.jpg
- ImageFX:aitest01_image_fx.jpeg
- microsoft designer:aitest01_designer.jpeg
アニメ・3D系
AnimateDiff https://animatediff.github.io/
Youtube関連
YouTubeにある動画を素材にするのは、濃いグレーですが、どういうものがあるかだけ。
すでにある動画の要約
動画の編集編集
検証 5 Claude3 有料版の検証
仕様
Claude3 の有料版には無料版と同じで速いso-netと、より高性能とされるOpusがあり、さらに回答のニュアンスの選択肢として、教育目的というものがある。
フォントはシステム準拠の他、ディスレクシアフレンドリーなフォントという選択肢がある。
個別の検証
以下はOPusの教育目的でやった結果
日本語の「~間」と「~間に」と違いを手短に教えてください。
- sonet aitest_claude3_01.png
上の回答の多言語化
- やさしい日本語aitest_claude3_08.png
学習者の活用例
教える側での活用は今後いろいろな試行錯誤が出てくると思います。そういう意味で学習者がどう使っているのかを知ることがまず重要です。いろいろな記事や動画がすでにネットにあがっています。今のところ英語のリソースが最も多く、そこそこ日本語について説明できるのは英語のみという事情もあるようです。日本語に関するchatGTPの説明は、かなり問題がありますが、学習者のほうがしっかり気がついており、残念なことに、日本語ネイティブ(日本語教育関係者?)のほうが、「すごいツールだ!」「こう使える」的な記事や動画が多く、検証が甘く、いまひとつという傾向もあります。
英語の日本語学習者コミュニティではいろんな議論が行われています。
search results - ChatGPT https://www.reddit.com/r/LearnJapanese/search/?q=ChatGPT&restrict_sr=1&sr_nsfw=
Search results for 'ChatGPT' - WaniKani Community https://community.wanikani.com/search?q=ChatGPT
Why you shouldn't rely on ChatGPT for Japanese language learning. : LearnJapanese https://www.reddit.com/r/LearnJapanese/comments/zhsvfz/why_you_shouldnt_rely_on_chatgpt_for_japanese/
Are we Ready to Learn Japanese with ChatGPT? - Japanese Level Up https://japaneselevelup.com/are-we-ready-to-learn-japanese-with-chatgpt/
Practicing Japanese with ChatGPT - Japanese Language / Resources - WaniKani Community https://community.wanikani.com/t/practicing-japanese-with-chatgpt/59764
記事も多いです。
【記事】I Used ChatGPT To Teach Me Japanese FAST: Here Is What I Learned In 20 Minutes! | by Fahri Karakas | ILLUMINATION | Feb, 2023 | Medium https://medium.com/illumination/i-used-chatgpt-to-teach-me-japanese-fast-here-is-what-i-learned-in-20-minutes-c26895cc2941
上級者の例
上級者にとっては有益です。すでにいろいろと活用されているようです。多分、教師があれこれ言わなくても自分でやるのでは。
OpenAIのChatGPTに外国人の苦手なビジネス日本語を任せてみた | DevelopersIO https://dev.classmethod.jp/articles/openai-chatgpt-business-japanese-help-for-foreigners/
動画の例
Youtubeには多数のやってみた動画がアップされています。
その他
https://www.youtube.com/watch?v=wCm2LK6O-T8
https://www.youtube.com/watch?v=oftKFnXYu28
日本語の動画も。
https://www.youtube.com/watch?v=o_q6FYliPiA
https://www.youtube.com/watch?v=o_q6FYliPiA
いろんな言語で試してみた動画も https://www.youtube.com/watch?v=veLfMlW5pN0
Youtubeの検索結果
chat gpt japanese learning - YouTube https://www.youtube.com/results?search_query=chat+gpt+japanese+learning
学習者が聞きそうなこと
日本語の学習者辞書や教科書に載っていないこと、教師にも教室でも聞きにくいことがAIで検索される可能性は高いです。ChatGPTとGeminiで調べてみます。
- 性についての語や表現について(いろいろと語を引き出すために、結構慎重に言葉を選んで何度か質問することが必要でした) → シェアaitest_sei01.pngaitest_sei02.pngaitest_sei03.pngaitest_sei04.pngaitest_sei05.png Geminiでは → aitest_sei06.png
- 罵倒する表現(これも引き出すのが難しいようです) → aitest_batoo01.pngaitest_batoo02.png
方言
- 方言で答えてくれるか?
専門家による検証
Bardの性能をBingやChatGPTと比較してみた|IT navi|note https://note.com/it_navi/n/n45d8b1c999d8
ChatGPT vs BERT:どちらが日本語をより理解できるのか? | Fintan https://fintan.jp/page/9126/?s=09
第1回 疑問を解決する | 「ChatGPTと語学学習」森田学 | web ふらんす https://webfrance.hakusuisha.co.jp/posts/7186?s=09
LLM 勉強会 - LLM 勉強会 https://llm-jp.nii.ac.jp/?s=09
大規模言語モデルは相関関係から“本当の”因果関係を推定できるのか? 40万個の問題で研究者らが調査:Innovative Tech - ITmedia NEWS https://www.itmedia.co.jp/news/articles/2306/23/news047.html
GPT-4では助詞によって文法関係を示す日本語の特性を学習できている
日本語苦手なろう者にとっても割といいツールになるのは、第二言語習得で使えそうというのでわかるな
Noam Chomsky: The False Promise of ChatGPT https://www.nytimes.com/2023/03/08/opinion/noam-chomsky-chatgpt-ai.html
「ChatGPTは凡庸な悪」言語学の大家、チョムスキー氏が指摘する、その本当の問題とは?(平和博) - 個人 - Yahoo!ニュース https://news.yahoo.co.jp/byline/kazuhirotaira/20230313-00340867
Modern language models refute Chomsky’s approach to language - lingbuzz/007180 https://lingbuzz.net/lingbuzz/007180
〈特別公開〉対談 わかりたいヒトとわかったふりをするAI | WEB世界 https://websekai.iwanami.co.jp/posts/7372
生成系AI(ChatGPT, BingAI, Bard, Midjourney, Stable Diffusion等)について | utelecon https://utelecon.adm.u-tokyo.ac.jp/docs/20230403-generative-ai
大規模言語モデル(LLM)に関連するビジネスを展開する際に留意すべき法規制・知的財産権・契約 | STORIA法律事務所 https://storialaw.jp/blog/9239
スタンドード大学が23年4月に出したAIのレポ AI Index Report 2023 – Artificial Intelligence Index https://aiindex.stanford.edu/report/
上の関連の記事 The takeaways from Stanford’s 386-page report on the state of AI | TechCrunch https://techcrunch.com/2023/04/04/the-takeaways-from-stanfords-386-page-report-on-the-state-of-ai/?tpcc=tcplustwitter
ChatGPTなどの対話型AIは「正解を探す検索エンジン」ではなく「単語の計算機」と考えるべきだという指摘 - GIGAZINE https://gigazine.net/news/20230404-chatgpt-language-models-calculator-for-words/
GPT-1→GPT-2→GPT-3→GPT-3.5→ChatGPT→GPT-4までの進化の軌跡と違いをまとめてみた|スタビジ https://toukei-lab.com/gpt
ChatGPT、何が問題か 元グーグル社員「非常に無責任で無謀」:朝日新聞デジタル https://digital.asahi.com/articles/ASR444W17R42ULFA004.html?ptoken=01GXACXV36HKCQRMG4RF9NCVR5
ChatGPTで大学レポートをマスター!初年度学生のための教科書 - Google ドキュメント https://docs.google.com/document/d/1b29b-cMc515RqPIwUfc0N_h974RRufKzOYHa27UvMKY/edit#heading=h.n1n9ju6pktjz
ChatGPT 人間のフィードバックから強化学習した対話AI https://www.slideshare.net/ShotaImai3/chatgpt-254863623
ChatGPTで独自データを利用できるLlamaIndexはどんな仕組みで動いているのか?調べてみました | DevelopersIO https://dev.classmethod.jp/articles/llamaindex-overview/
ChatGPTに日本語テキストを入力するとき、日本語テキストがどのように分割されてトークンに変換されるかをtiktokenでのぞく - nikkie-ftnextの日記 https://nikkie-ftnext.hatenablog.com/entry/how-chatgpt-tokenize-japanese-text-tackling-with-tiktoken
QNAPの全文検索「Qsirch」で、NAS内の文書をChatGPTのコンテキストとして利用する【イニシャルB】 - INTERNET Watch https://internet.watch.impress.co.jp/docs/column/shimizu/1505646.html
生成AIに“生成AIが作った文章”を学習させ続けるとどうなる? 「役立たずになる」と英国チームが報告:Innovative Tech - ITmedia NEWS https://www.itmedia.co.jp/news/articles/2306/21/news059.html
AAMT-journal-No78 https://www.aamt.info/wp-content/uploads/2023/06/AAMT-journal-No78.pdf
「字幕大国ニッポン」でも役に立つ? DaVinci Resolve β版の文字起こし機能を試してみた:小寺信良の「プロフェッショナル×DX」(1/3 ページ) - ITmedia NEWS https://www.itmedia.co.jp/news/articles/2306/23/news111.html?utm_source=dlvr.it&utm_medium=facebook
検閲なしのチャットAI「FreedomGPT」はChatGPTのような安全フィルターがなく倫理観皆無で「ヒトラー称賛」「対ホームレス発砲提案」などやりたい放題 - GIGAZINE https://gigazine.net/news/20230331-freedomgpt/
最近話題になった大規模言語モデルまとめ|npaka|note https://note.com/npaka/n/n00e5c66b6c18
「Excel」上で「ChatGPT」を簡単に扱えるようにする方法が開発される! - 窓の杜 https://forest.watch.impress.co.jp/docs/news/1492387.html
大規模言語モデルはデータサイエンティストを駆逐するか - ABEJA Tech Blog https://tech-blog.abeja.asia/entry/gpt-debate-202308
「AIキャラクターの言動に深みを持たせる」 - Speaker Deck https://speakerdeck.com/sr2mg4/23-aikiyarakutanoyan-dong-nishen-miwochi-taseru
「チョムスキーの生成文法は死んだ」ポレミック論文 https://is.gd/WPPcTm
Generative AI for Everyoneから、古のNLPエンジニアの心に刺さったこと8選|べいえりあ https://note.com/csstudyabroad/n/n5aba3a708f3a?sub_rt=share_pw
GeminiとChatGPT4の比較 https://twitter.com/asaokitan/status/1755577894796194219
トークンの長さ問題
https://twitter.com/asaokitan/status/1748381150442303830
https://twitter.com/asaokitan/status/1748386771606626669
https://twitter.com/xiPJ/status/1748389034542694409
AIに文章の校正を依頼する[無料で使えるAI校正ツールの比較]一番使えるAIは? | Tokyo校正視点|校正・校閲の専門サイト https://kousei.club/proofreading-with-ai/
より高度な活用の可能性
リソースを限定して使う
これは誰しも考えるようです。つまり、信頼できるリソースに限定すれば、より精度が高いものになるのでは、ということです。
embedding
これは、現在、テスト中でもあり、わかってきたらレポします。(2024年?)
【記事】【ChatGPT】Embeddingsでドメイン知識をChatGPTに理解させる - Qiita https://qiita.com/yuno_miyako/items/589efa5c5dd6df2b16a7
【記事】【Langchain】EmbeddingでChatGPTに自分専用Q&Aをしてもらう方法 | 楽しい生産性ブログ https://ict-worker.com/ai/gpt35-with-smeca.html
【記事】自分のコンテンツを学習したカスタムChatBotを作る方法 https://zenn.dev/karaage0703/articles/c8baa66c40f9b7
自前で構築
誰でも自前のナレッジベースをソースにしてAI生成系で応答システムを作りたいと考えると思います。これはいろんな方法があるようで、パッケージになったサービスなどもあり、これだとディレクトリを指定すれば作ってくれる、データの提供ありなら月額2000円から、みたいなかんじです。ただしデータの取得はされるので社外秘などは難しい。日本語の学習データのリファランスくらいならいいかも、というところです。
その他、自前で自分のサーバーでやる方法もあります。そういうオープンソースもありますが、そうなると運用も含め専門家が必要ですが、セッティングだけならサイト運用している人なら頑張ればやれそうです。
【動画】ChatGPT APIのEmbeddingカスタマイズ入門 - YouTube https://www.youtube.com/watch?v=RKCFi3nqVFw
ChatGPT_APIのEmbedding_カスタマイズ入門 - Speaker Deck https://speakerdeck.com/ryoheiigushi/chatgpt-apinoembedding-kasutamaisuru-men
ファインチューニング
【記事】OpenAI API の ファインチューニングガイド|npaka https://note.com/npaka/n/ne4dfd4480ead
【記事】LLMのファインチューニング で 何ができて 何ができないのか|npaka https://note.com/npaka/n/nec63c01f7ee8?s=09
『日本語教師読本 17 : 語学教師のための自然言語処理の基本』
やさしい日本語や南米の日本語学習者の調査など、日本語教育に深く関わってきた著者が、日本語教育関係者のためにはじめて書いた、自然言語処理の本。
山本 和英 言語商会、元長岡技術科学大学准教授、元言語処理学会理事著
出版社による紹介ページへ