AI研究:AI研究 1 概要 | AI研究 2 入門 | AI研究 3 情報 | AI研究 4 検証
→ ChatGPT、Gemini,Claudeは、AI研究 2 入門でまとめています。ここは、その他のサービス中心に整理します。ただし、無数にありますので、目についたものだけ。
教えてAI byGMO - あなたの欲しいが見つかる生成AIのプロンプトポータルサイト ChatGPTやGeminiに役立つ https://oshiete.ai/
Text > Text といっても、大手は、画像も動画も音声も対応可能だったり、近々対応予定なので、そのうち何でもありになりそうです。画像や動画に特化したサービスのほうが先行きは怪しいかもです。
その他、クローン(違う方法で同じようなことができるようにしたもの)や、派生サービス(ChatGPTを利用したもの)、その他(まったく違うAI系サービスなど)は以下です。順不動。ChatGPT以降、たくさん出てきていますが、画像系、動画系などは以前からあるものがほとんどです。従来のサービスもAIを取り入れたりしてますので、そのうちすべてAI系サービスになりそうですが。。。
前述のように、1,2年で消えるサービスも多いでしょうし、今はアカウントを作らず、デモを眺めるくらいがいいのではと思います(ただしベンチャー系企業のデモ動画は「もっともうまくいった例」で結構ハッタリということもあります。完全にウソ動画だったこともあります。また法人向けサービスで年契約数千万で、個人まで下りてこないみたいなことも多いです)。
□ Perplexity AI https://www.perplexity.ai/about
□ Stability AI https://ja.stability.ai/
□ Shepherd
GitHub - facebookresearch/Shepherd: This is the repo for the paper Shepherd – A Critic for Language Model Generation https://github.com/facebookresearch/Shepherd
METAによる ChatGPTのチェック用AI 論文 [2308.04592] Shepherd: A Critic for Language Model Generation https://arxiv.org/abs/2308.04592
23年12月、ChatGPTと同等の性能のAIが発表されました。
GoogleのマルチモーダルAI「Gemini」ベースのプログラミングに特化したAI「AlphaCode 2」登場、競技プログラミング上位15%に入る性能 - GIGAZINE https://gigazine.net/news/20231207-google-gemini-programming-alphacode-2/
Introducing Gemini: Google’s most capable AI model yet https://blog.google/technology/ai/google-gemini-ai/#scalable-efficient
Gemini: Excelling at competitive programming - YouTube
Google AI for Developers https://ai.google.dev/pricing?authuser=0
Gemini Slack bot https://github.com/odashi/gemini-slackbot
Gemma: Google introduces new state-of-the-art open models https://blog.google/technology/developers/gemma-open-models/
ライセンスについて
Building Open Models Responsibly in the Gemini Era | Google Open Source Blog https://opensource.googleblog.com/2024/02/building-open-models-responsibly-gemini-era.html?m=1
text to video
ChatGPTをいち早くBingで採用し、検索、ブラウザに組み込んでいる。独自開発でもいろいろ。
人工知能 (AI) のソリューション | Microsoft AI https://www.microsoft.com/ja-jp/ai
ビジネス向けのバージョン
GitHub - microsoft/azurechatgpt: 🤖 Azure ChatGPT: Private & secure ChatGPT for internal enterprise use 💼 https://github.com/microsoft/azurechatgpt
【記事】Microsoft、生成AI「Copilot」の企業顧客が著作権侵害で提訴されたら「責任を持つ」 - ITmedia NEWS https://www.itmedia.co.jp/news/articles/2309/08/news101.html
Release of Pre-Trained Models for the Japanese Language Kei Sawada, Tianyu Zhao, Makoto Shing, Kentaro Mitsui, Akio Kaga, Yukiya Hono, Toshiaki Wakatsuki, Koh Mitsuda https://t.co/x2jgFogVUT
MS版のCode Interpreter
https://github.com/nlpxucan/WizardLM/tree/main/WizardCoder
【記事】米Microsoftら、“コーディング専用”大規模言語モデル「WizardCoder」開発 文章から高品質なコード出力:Innovative Tech - ITmedia NEWS https://www.itmedia.co.jp/news/articles/2307/21/news066.html#utm_term=share_sp
https://designer.microsoft.com/
【記事】AIがデザインする新サービス「Microsoft Designer」を試す。最終的には使い手のセンスの問題か…【イニシャルB】 - INTERNET Watch https://internet.watch.impress.co.jp/docs/column/shimizu/1499380.html
» Announcing the Preview of OpenAI Whisper in Azure OpenAI service and Azure AI Speech - Microsoft Community Hub https://techcommunity.microsoft.com/t5/azure-ai-services-blog/announcing-the-preview-of-openai-whisper-in-azure-openai-service/ba-p/3928388
Microsoft Copilot Studio | Extend Copilots or Create Your Own https://www.microsoft.com/en-us/copilot/microsoft-copilot-studio
【記事】 “オリジナルCopilot”が作れる「Copilot Studio」登場 スタンドアロン型にも対応 GPTとも連携:Microsoft Ignite - ITmedia NEWS https://www.itmedia.co.jp/news/articles/2311/16/news078.html
【記事】Copilot Studioを使ってみた。注意点と実際にかかるお金の話など|shi3z https://note.com/shi3zblog/n/ne4429ab1ee4b
MicrosoftがAIアシスタント・Copilotのフル機能版「Copilot Pro」を発表、月額2900円で最新LLMを利用したりオリジナルCopilotを構築したり - GIGAZINE https://gigazine.net/news/20240116-microsoft-copilot-pro/?s=09
アプリ
無料でChatGPT4 が利用できる。ひとつのテーマで30回まで使える。
Google Play のアプリ https://play.google.com/store/apps/details?id=com.microsoft.copilot&hl=ja&gl=US
App Storeで https://apps.apple.com/jp/app/microsoft-copilot/id6472538445
やってみた
「~わな」という語尾とは何か?という質問 screenshot_20240116-052708.png
画像解析→英訳の結果
screenshot_20240116-052749.pngscreenshot_20240116-052756.pngscreenshot_20240116-052807.png
ザッカーバーグ、大量のGPUを確保…2024年中にエヌビディアの「H100」を34万個 | Business Insider Japan https://www.businessinsider.jp/post-281501
23年7月発表
【記事】Microsoft and Meta expand their AI partnership with Llama 2 on Azure and Windows - The Official Microsoft Blog https://blogs.microsoft.com/blog/2023/07/18/microsoft-and-meta-expand-their-ai-partnership-with-llama-2-on-azure-and-windows/
Meta、商用利用も可能な大規模言語モデル「Llama 2」をオープンソースで提供開始 - INTERNET Watch https://internet.watch.impress.co.jp/docs/news/1517420.html
→ 原則オープンソースなので、自分のパソコンにインストールしてアレコレ試せるが、かなりのマシンパワーが必要。
👉 商用利用可能だが、億単位の稼働だとライセンスありなど完全なオープンソースではない。
👉 とはいえ一応オープンソースなので派生モデルも多い模様。
Uncensored(無修正?チューニング無し版?) TheBloke/llama2_7b_chat_uncensored-GGML · Hugging Face https://huggingface.co/TheBloke/llama2_7b_chat_uncensored-GGML
Meta AI https://ai.meta.com/
【記事】Llama 2 の情報まとめ|npaka https://note.com/npaka/n/ncc6c32fcfd38
【記事】【ローカルLLM】Llama-2とVicuna v1.5の日本語チャット能力を比べてみる|Baku https://note.com/bakushu/n/n4e8c854e6138?s=09
【記事】Metaの「Llama 2」をベースとした商用利用可能な日本語LLM「ELYZA-japanese-Llama-2-7b」を公開しました|ELYZA, Inc. https://note.com/elyza/n/na405acaca130
翻訳と音声を同時に生成
facebook/seamless-m4t-large · Hugging Face https://huggingface.co/facebook/seamless-m4t-large
日本語重視のAI
Japanese StableLM Base Alpha 7B」と「Japanese StableLM Instruct Alpha 7B」
日本語言語モデル「Japanese StableLM Alpha」をリリースしました — Stability AI Japan https://ja.stability.ai/blog/japanese-stablelm-alpha
【記事】Google Colab で Japanese StableLM Alpha を試す|npaka https://note.com/npaka/n/nfacbeb1ae709?s=09
【記事】日本語特化型言語モデルのJapanese StableLM Alphaをテストしてみた|IT navi https://note.com/it_navi/n/n5eb0f57d7d74
Announcing StableCode — Stability AI https://stability.ai/blog/stablecode-llm-generative-ai-coding
Stability AIがオープンソースのコーディング補助AI「StableCode」を発表 - GIGAZINE https://gigazine.net/news/20230809-stability-ai-stablecode/
XAI OFFCIAL SITE https://xai-official.com/
?
特に表立っては無いが、いろいろと進行中である模様。
【記事】Appleのティム・クックCEOが独自の生成AIを開発中であると認める、Appleの研究開発費は前年同期より約4400億円も増加 - GIGAZINE https://gigazine.net/news/20230804-apple-generative-ai-rd-spend/
【記事】アップルがWWDCで発表したAI機能 - ZDNET Japan https://japan.zdnet.com/article/35204930/
Adobe Firefly https://www.adobe.com/jp/sensei/generative-ai/firefly.html
→ サブスク会員向け。画像のところで紹介しています。著作権クリアを明言しているのが強み。
【記事】Amazon、生成AI強化へ Anthropicに40億ドル出資 - Impress Watch https://www.watch.impress.co.jp/docs/news/1534220.html
NTT版大規模言語モデル「tsuzumi」 | NTT R&D Website https://www.rd.ntt/research/LLM_tsuzumi.html?s=09
□ japanese-large-lm
【記事】LINE、日本語の大規模言語モデル公開 オープンソースで 商用利用もOK - ITmedia NEWS https://www.itmedia.co.jp/news/articles/2308/14/news138.html 【記事】LINEの3.6B言語モデルで遊んだら爆笑した|shi3z https://note.com/shi3zblog/n/nb999c81d01c3
□ ChatPDF - Chat with any PDF! https://www.chatpdf.com/?via=rick
□ stabilityai/FreeWilly2 · Hugging Face
https://huggingface.co/stabilityai/FreeWilly2
【記事】Stability AIがChatGPTと同等の性能を持つオープンソースの大規模言語モデル「FreeWilly」を公開 - GIGAZINE https://gigazine.net/news/20230724-stability-ai-llm-freewilly/
□ lightblue/japanese-mpt-7b · Hugging Face
https://huggingface.co/lightblue/japanese-mpt-7b
【記事】MIT Tech Review: 東大発スタートアップ、67億パラメーターの日本語LLMをOSSで公開 https://www.technologyreview.jp/n/2023/07/25/312981/
□ Weblab-10B(東大松尾研)
商用はダメだがオープンソースを自称している。
100億パラメータサイズ・日英2ヶ国語対応の大規模言語モデル“Weblab-10B”をオープンソースで公開しました。 – 東京大学松尾研究室 – Matsuo Lab
【記事】東大松尾研発のLLM(Weblab-10B)を試す|shi3z https://note.com/shi3zblog/n/n45cd5957d773?s=09
□ Sakana AI
【記事】GoogleのトップAI研究者2人、東京でAI企業Sakana.ai立ち上げ - ITmedia NEWS https://www.itmedia.co.jp/news/articles/2308/18/news078.html
日本の美を学んだAI:浮世絵風画像生成モデルEvo-Ukiyoeと浮世絵カラー化モデルEvo-Nishikieを公開 https://sakana.ai/evo-ukiyoe/
□ AIアシスタントの記憶管理をするライブラリー
中期記憶は会話の日次要約を5日分、長期記憶はニックネームとか好きな食べ物とか項目別で管理。プロンプトの詰めがまだ甘いと思うからぜひ使ってみて改善案くださるとうれしいです
GitHub - uezo/chatmemory: Long-term and medium-term memories with you and chatbot💕 https://github.com/uezo/chatmemory
□ Xwin-LMの性能を日本語LLMやChatGPTと比較してみた|IT navi https://note.com/it_navi/n/n9a5cdd84659d?sub_rt=share_b
□ Elicit 論文解析系 Elicit: The AI Research Assistant https://elicit.com/?s=09
□ RWKV-5 World v2 多言語得意
https://huggingface.co/spaces/BlinkDL/RWKV-Gradio-1
□ DeepSeek
DeepSeek https://chat.deepseek.com/sign_in
□ ABCIでOrion14Bを使って10Kマルチターン日本語会話データセットを生成
□ ABCIでOrion14Bを使って10Kマルチターン日本語会話データセットを生成した|shi3z https://note.com/shi3zblog/n/n1df103edbd57?sub_rt=share_pb
□ 101言語に対応したオープンソースの大規模言語モデル「Aya」をCohere for AIがリリース - GIGAZINE https://gigazine.net/news/20240214-aya-cohere-for-ai/?s=09
□ 無料のチャットボットAI「Chat With RTX」をNVIDIAがリリース、GeForce RTX GPU搭載PCでローカル動作が可能 - GIGAZINE https://gigazine.net/news/20240214-nvidia-chat-with-rtx/
□ Paper page - Pangea: A Fully Open Multilingual Multimodal LLM for 39 Languages https://huggingface.co/papers/2410.16153
【注意】 日本語教育の場合は、学習者の音声をできるだけそのままテキスト化したいというニーズがあるので、日本語に最適化して補正をしない機能も大事です。できれば、補正アリナシでスイッチングできるのが理想です。
テスト用の音声ファイルは以下などから取得できます。
高橋弘太研究室 > 音声データベース :プロのナレーターなど日本語ネイティブの音声 https://www.it.cei.uec.ac.jp/SRV-DB/
私どものアーカイブの音声もCC BY SA です。 https://drive.google.com/drive/u/0/folders/0B5TCRiHE2W6odlE2c256dlctT2s?resourcekey=0-shOzOWwj-x_BURHVV0CSGw
日本語学習者会話データベース :日本語学習者の音声
□ Kotoba Technologies https://www.kotoba.tech/
Demo: https://shorturl.at/cjmAC Discord: https://shorturl.at/pzEL8 Model: https://shorturl.at/oyK16
文字起こし系はいろいろありますが、お試しでやってみるのは以下がわかりやすいです。
Whisper Web - a Hugging Face Space by Xenova https://huggingface.co/spaces/Xenova/whisper-web
:OpenAIの文字起こし系サービス
https://openai.com/research/whisper
→ これを利用したサービス、アプリなどは多数作られている。デフォルトで日本語にも対応している。最初に設定で日本語にすることと、jsonファイルでエクスポートなのでエディタで開いて中身をみてください。現時点でも文字起こしはこれでほぼ大丈夫そうですし、もうちょっと日本語対応がよくなれば、全部これになりそうです。
→ 実際に試せるサイト
□ Whisper - a Hugging Face Space by openai 本家。ブラウザーで音声入力 https://huggingface.co/spaces/openai/whisper
□ Whisper Web - a Hugging Face Space by Xenova (音声ファイルをアップする式。URL指定は不安定) https://huggingface.co/spaces/Xenova/whisper-web
□ Whisper Gpt Voicescribe - a Hugging Face Space by yamashiro3 Youtubeから https://huggingface.co/spaces/yamashiro3/Whisper-gpt-voicescribe
□ Free Youtube URL Video-to-Text Using OpenAI Whisper - a Hugging Face Space by SteveDigital Youtubeに特化したものらしい
https://huggingface.co/spaces/SteveDigital/free-fast-youtube-url-video-to-text-using-openai-whisper
その他 whisper 文字起こしで検索すれば有料無料いろいろヒットします。
高速版 Distil-Whisper
文字起こし「Whisper」の高速化モデル「Distil-Whisper」、スマホで別人の声になりきる「LLVC」、感情付きプロンプトなど重要論文5本を解説(生成AIウィークリー) | テクノエッジ TechnoEdge https://www.techno-edge.net/article/2023/11/06/2202.html
1)長めの日本語学習者の会話音声
ここの日本語学習者の音声(No98)をこれで(事前に設定を日本語にした)やってみました。
aitest_xenova.zip(textファイルとjsonファイルがあります)
→20分弱の音声ファイル。文字起こしはだいたい5分くらい。
2)90秒のラジオの会話
(著作権的にはグレーですが、切り抜き的な動画の音声) https://www.youtube.com/watch?v=X2n_55iXCpY
文字起こしは30秒くらい。日本語と英語でエクスポート。
3)これを、この動画(期間限定のテレビ東京の孤独のグルメ。30分)で試してみましたが、エンコードが終わったかと思ったらエラーになりました。
□ Personal Voice
Apple、Live Speech、Personal Voice、およびその他の新しいアクセシビリティ機能をプレビュー - Apple (日本) https://www.apple.com/jp/newsroom/2023/05/apple-previews-live-speech-personal-voice-and-more-new-accessibility-features/
□ 声をシミュレートする
This is wild. Used AI to translate this from English to Japanese. It changed my mouth to match the Japanese. Anyone know if the translation is good? pic.twitter.com/wpVC6zbCl8
— Jim Spencer - Iowa Tesla Guy (@iowateslaguy) October 21, 2023
あなたの声、無限大! OnSay.ai https://onsay.ai/
これで日本語の勉強を始めたばかりの人とか来日したての人の動画を録って「もしあなたが日本語上級者になったらこんなかんじで日本語をしゃべるだろう」というシミュレーションをした音声、動画が作れそうです。
【記事】アップル、iPhoneやMacが自分そっくりのAI生成声で話す「Personal Voice」発表。学習もローカルで完結(CloseBox) | テクノエッジ TechnoEdge https://www.techno-edge.net/article/2023/05/17/1299.html
□ TalkBerry - Talk To ChatGPT https://chrome.google.com/webstore/detail/talkberry-talk-to-chatgpt/facjhgcdnbfghhbnmfjgkncnbimfdakb/related
【記事】ChatGPTと音声会話ができるChrome拡張機能「TalkBerry」がすごい #TrendBuzz | ライフハッカー・ジャパン https://www.lifehacker.jp/article/2304-now-you-can-talk-to-chatgpt-with-your-voice/
□ AudioLDM
Text-to-Audio Generation with Latent Diffusion Models - Speech Research https://audioldm.github.io/audioldm2/
【記事】音声生成モデルAudioLDM2を試す|はまち https://note.com/hamachi_jp/n/n284a7b53749b?s=09
スマートスピーカー+AI
会話練習マシンはこれが完成形?
【記事】Googleアシスタントに生成AIが搭載される計画が進行中、「オーケーGoogle」で質問すると検索結果をAIが要約してくれるようになる可能性 - GIGAZINE https://gigazine.net/news/20230801-google-assistant-artificial-intelligence/
【記事】米アマゾン「アレクサ」に生成AI 対話機能が向上、家庭の機器でも:朝日新聞デジタル https://www.asahi.com/articles/ASR9P3Q9QR9PUHBI008.html
□ Suno
【Suno AI】テキストだけで曲、歌詞、歌声を作れる禁断の音楽生成AI | WEEL https://weel.co.jp/media/suno
□ yodas
spnet/yodas · Datasets at Hugging Face https://huggingface.co/datasets/espnet/yodas
□ NHKのAI研究
日本語音声合成を用いたAIアナウンスシステムの研究と実用化 https://www.jstage.jst.go.jp/article/itej/78/2/78_234/_article/-char/ja
□ DaVinci Resolve
【記事】「字幕大国ニッポン」でも役に立つ? DaVinci Resolve β版の文字起こし機能を試してみた:小寺信良の「プロフェッショナル×DX」(1/3 ページ) - ITmedia NEWS https://www.itmedia.co.jp/news/articles/2306/23/news111.html?utm_source=dlvr.it&utm_medium=facebook
👉 上のテキスト系や画像系でもseamless-m4tのように、文字起こし機能アリ的なものもあります。今後、あれもこれもできるというAIサービスは増えるので文字起こしができるタイプは増えそうです。
【記事】OpenAIの文字起こしAI「Whisper」の使い方 | DXを推進するAIポータルメディア「AIsmiley」 https://aismiley.co.jp/ai_news/what-is-whisper/
【記事】文字起こしAI「Whisper」を誰でも簡単に使えるようにした超高精度文字起こしアプリ「writeout.ai」使い方まとめ、オープンソースでローカルでも動作OK - GIGAZINE https://gigazine.net/news/20230309-writeout-ai/
【記事】ChatGPT APIとWhisper APIで議事録文字起こしアプリを作り、Hugging Face Spacesで公開する | gihyo.jp https://gihyo.jp/article/2023/04/programming-with-chatgpt-02
【記事】Whisperで文字起こしをした議事録の発話者の名前を自動的に判定する! - Qiita https://qiita.com/sakasegawa/items/50d76ead3038e735e4fe
【記事】ポッドキャストをAIで文字起こしして共有するサービス「LISTEN」、音声のホスティング機能を追加 - INTERNET Watch https://internet.watch.impress.co.jp/docs/news/1523159.html
などいろいろあります。
大手中心に全体図を整理すると…
有料のものは、月額などの定額制と生成回数分のクレジットを購入するという方式が多い。GoogleのBARDは画像も対応。今後は全部対応という方向になりそう。
□ DreamStudio https://dreamstudio.ai/
画像生成AI「Stable Diffusion」の公式有料アプリ「DreamStudio」の無料版「StableStudio」がオープンソースで公開される - GIGAZINE https://gigazine.net/news/20230518-stable-diffusion-stability-ai-dreamstudio-stablestudio/
□ Adobe Firefly https://www.adobe.com/jp/sensei/generative-ai/firefly.html :著作権を完全にクリアしたと明言している。
ジェネレーティブAI「Adobe Firefly」を Adobe Creative Cloudに https://blog.adobe.com/jp/publish/2023/03/21/cc-bringing-generative-ai-into-creative-cloud-with-adobe-firefly
□ Midjourney https://midjourney.com/home/?callbackUrl=%2Fapp%2F
上級者向け Midjourney V6 alpha の8つのテクニック/Midjourneyの上級テクニックで写真集のプロトタイプを作成する・第6回|CreativeEdge Vlog https://note.com/creative_edge/n/n7508cf9b574e?s=09
□ Stable Diffusion Online https://stablediffusionweb.com/
□ 多言語OCR GitHub - VikParuchuri/surya: Accurate line-level text detection and recognition (OCR) in any language https://github.com/VikParuchuri/surya
□ Imagen: Text-to-Image Diffusion Models https://imagen.research.google/
□ Craiyon, AI Image Generator https://www.craiyon.com/
□ 🤖 🖼 AI Art Generator: Create Stunning AI Art - NightCafe Creator https://creator.nightcafe.studio/
□ Superpower ChatGPT https://chrome.google.com/webstore/detail/superpower-chatgpt/amhmeenmapldpjdedekalnfifgnpfnkc?hl=ja
□ YouTube Summary with ChatGPT https://chrome.google.com/webstore/detail/youtube-summary-with-chat/nmmicjeknamkfloonkhhcjmomieiodli
□ Talk-to-ChatGPT https://chrome.google.com/webstore/detail/talk-to-chatgpt/hodadfhfagpiemkeoliaelelfbboamlk?authuser=0
□ ChatGPT to Notion https://chrome.google.com/webstore/detail/chatgpt-to-notion/oojndninaelbpllebamcojkdecjjhcle?hl=ja
□ Voice Control for ChatGPT https://chrome.google.com/webstore/detail/voice-control-for-chatgpt/eollffkcakegifhacjnlnegohfdlidhn
□ WebChatGPT: インターネットにアクセスできる ChatGPT https://chrome.google.com/webstore/detail/webchatgpt-chatgpt-with-i/lpfemeioodjbpieminkklglpmhlngfcn?hl=ja
□ ChatGPT for Google https://chrome.google.com/webstore/detail/chatgpt-for-google/jgjaeacdkonaoafenlfkkkmbaopkbilf?hl=ja
□ ChatGPT Writer - Write mail, messages with AI https://chrome.google.com/webstore/detail/chatgpt-writer-write-mail/pdnenlnelpdomajfejgapbdpmjkfpjkp
□ Merlin - ChatGPT Assistant for All Websites https://chrome.google.com/webstore/detail/merlin-chatgpt-assistant/camppjleccjaphfdbohjdohecfnoikec
□ ChatGPT Glarity、YouTubeとGoogleを要約 https://chrome.google.com/webstore/detail/chatgpt-glarity-summarize/cmnlolelipjlhfkhpohphpedmkfbobjc?hl=ja
□ Ideogram: Helping people become more creative. 画像内の文字が崩れない https://ideogram.ai/login
□ https://vgu.community/house/varygoodkun/drawing
□ Akuma https://akuma.ai/login?destination=https%3A%2F%2Fakuma.ai%2Fcharacters
□ Sakana
日本語対応の画像生成AI、東京発のSakana AIが発表 既存モデルより10倍高速 https://ascii.jp/elem/000/004/195/4195324/
【記事】画像生成AI「Stable Diffusion」「Midjourney」で使える呪文のような文字列にパラメーターを簡単に追加できる「promptoMANIA」の使い方まとめ - GIGAZINE https://gigazine.net/news/20220905-promptmania/
大手は動画機能もあるが、動画専門のサービスもある。ただし、大手に買ってほしいベンチャーなども多いので、そのうち買収、統合が進む可能性あり。
□ stable-diffusion
https://ja.stability.ai/stable-diffusion
【記事】Stable Diffusionとは?話題の画像生成AIの使い方・初心者向けのコツも徹底解説! | DXを推進するAIポータルメディア「AIsmiley」 https://aismiley.co.jp/ai_news/what-is-stable-diffusion/
□ animatediff https://animatediff.github.io/
【記事】【AnimateDiff】web UI拡張機能によるGIFアニメ生成 | ジコログ https://self-development.info/%E3%80%90animatediff%E3%80%91web-ui%E6%8B%A1%E5%BC%B5%E6%A9%9F%E8%83%BD%E3%81%AB%E3%82%88%E3%82%8Bgif%E3%82%A2%E3%83%8B%E3%83%A1%E7%94%9F%E6%88%90/
□ OpenAI Sora
□ dreambooth
【記事】DreamBooth:Stable Diffusionに自分の好きなキャラクターを描いてもらう事は可能 https://webbigdata.jp/post-15118/
□ Animate-A-Story
https://github.com/VideoCrafter/Animate-A-Story
□ Emu https://github.com/baaivision/Emu
□ FreeDrag https://github.com/LPengYang/FreeDrag
□ GEN-2
https://research.runwayml.com/gen2
文章や画像から動画を自動生成できる動画生成AI「Gen-2」の使い方|IT navi https://note.com/it_navi/n/n4dd2f4c158ab
□ Kaiber
MV作成 Kaiber https://kaiber.ai/
【記事】1枚の静止画から動画作成する「AnimateDiff」、Googleの画像学習改良版「HyperDreamBooth」など5本の重要論文を解説(生成AIウィークリー) | テクノエッジ TechnoEdge
https://www.techno-edge.net/article/2023/07/17/1603.html
全然検証できてません。デモをみるくらいにしておいてください。
□ Introducing Segment Anything: Working toward the first foundation model for image segmentation https://ai.facebook.com/blog/segment-anything-foundation-model-image-segmentation/
□ SAM AI - Segement Anything - YouTube https://www.youtube.com/watch?v=ySpP4EJKRes
□ stockmark
https://huggingface.co/stockmark/gpt-neox-japanese-1.4b
□ ChatGPT4利用で無料 https://www.perplexity.ai/?s=09
【記事】テキストや画像から3Dモデルを生成するオープンソースのAI「Shap-E」をOpenAIが発表 - GIGAZINE https://gigazine.net/news/20230510-openai-shap-e/
【記事】高性能・高速・軽量な日本語言語モデル LINE DistilBERTを公開しました https://engineering.linecorp.com/ja/blog/line-distilbert-high-performance-fast-lightweight-japanese-language-model
□ Generative AI for Enterprise | NVIDIA https://www.nvidia.com/en-us/ai-data-science/generative-ai/
□ Perplexity AI: Ask Anything https://www.perplexity.ai/
□ ChatSonic - A ChatGPT alternative with superpowers https://writesonic.com/chat
□ Writesonic - Best AI Writer, Copywriting & Paraphrasing Tool https://writesonic.com/
□ Stockimg AI https://stockimg.ai/
□ Paraphrasing Tool - QuillBot AI https://quillbot.com/
□ koala
Blog: https://bair.berkeley.edu/blog/2023/04/03/koala Demo: https://koala.lmsys.org
□ HuggingChat https://huggingface.co/chat/
□ Runway - Everything you need to make anything you want. https://runwayml.com/
□ chartgpt https://www.chartgpt.dev/
□ Otter|Otterは英語音声の文字起こしアプリです https://otter.ai/jp
□ GPTApp: Webアプリ全自動爆速作成 https://cgptapp.com/
□ GraphGPT https://graphgpt.vercel.app/
□ Galileo AI · Copilot for interface design https://www.usegalileo.ai/
□ Buster - a Hugging Face Space by jerpint https://huggingface.co/spaces/jerpint/buster
□ Uizard Autodesigner | Coming Soon | Uizard https://uizard.io/autodesigner/
□ ElevenLabs - Prime AI Text to Speech | Voice Cloning https://beta.elevenlabs.io/
□ Conformer-1: a robust speech recognition model https://www.assemblyai.com/blog/conformer-1/
□ rinna/japanese-hubert-base · Hugging Face https://huggingface.co/rinna/japanese-hubert-base
□ AssemblyAI | AI models to transcribe and understand speech https://www.assemblyai.com/
□ Gen-2 by Runway https://research.runwayml.com/gen2
□ Drag & Drop Headless CMS https://www.builder.io/
□ Postwise | Write, Schedule & Grow with Twitter AI https://postwise.ai/
□ Forefront: Powerful Language Models A Click Away https://www.forefront.ai/
□ ChatShape https://www.chatshape.com/
□ Runway - Everything you need to make anything you want. https://runwayml.com/
□ Fliki - Turn text into videos with AI voices https://fliki.ai/?via=shota
□ Transable https://navi.pep-rg.jp/ict-tips/transable
□ Search - Consensus - Evidence-Based Answers, Faster https://consensus.app/search/
□ Gamma App テーマからスライドなどをセットで生成 https://gamma.app/
□ AI-Powered Meeting Recorder for Zoom and Google Meet - tl;dv https://tldv.io/
□ Kickresume | Best Online Resume & Cover Letter Builder https://www.kickresume.com/en/
□ マインドマップAI - 与えられたテーマ・文章をマインドマップ化できるAI https://ai.satoru.net/mindmap/
□ Bark text to speak系 (同名の日本語の文章生成サービスもある模様。同名のサービスは多くあり混乱気味) https://bark-ai.com/
□ AutoGPT - Everything you need to know about AutoGPT, ChatGPT, and more. A great place for any AI enthusiast. https://autogpt.net/
APIなどを利用したサービス提供、既存のアプリなどのAI拡張などいろんな例がある。
【記事】ChatGPT搭載LINEボットを簡単作成 ツール無償提供 ユーザーローカル - ITmedia NEWS https://www.itmedia.co.jp/news/articles/2307/21/news096.html
□ Copilot Chrome Plugin https://typeset.io/copilot-chrome-plugin
各ブラウザの機能拡張で検索すれば無数に出てきます。音声再生、Youtubeなどのカスタマイズ、履歴の記憶など。ChatGPT自体の拡張系は仕様が変われば終わりですし、Google関係との連携はGoogle自体が自前のAIを組み込めば不要になるかもしれません。何よりChromeの拡張は寿命が短いので、ずっと使い続けられるかは?だという前提で使うのがコツだと思います。★評価が高く、ユーザーが多い(万単位が無難)ものが無難です。
Chrome ウェブストア - ChatGPT の検索結果
日本語指示データ・日本語擬似レビューの公開 - Megagon Labs | リクルート AI研究機関 https://www.megagon.ai/jp/blog/instruction-and-reviews/
関連サービスは無数に作られており、記録は難しい。ただし、日本語はほぼ無い。
24年4月の時点では、正直、従来のものにチャットを組み込んだだけか、簡単なプロンプトでAPIで作っただけのものが多く、まだお金を払ってやるほどのものは無いという印象です。
いちおう日本語学習向けとして開発されたっぽいもの
トレパ 日本語発話トレーニング https://torepa.jp/ja/
おしゃべり系
日本語学習目的ではないが以下のようなものも。(この種のもののほうが増えそう)
音声会話型おしゃべりAIアプリ Cotomo(コトモ) https://cotomo.ai/
エアフレンド(Airfriend) https://airfriend.ai/ja/
character.ai https://beta.character.ai/
組み込み系?
日本語は新たに開発されたものはほとんど無く、従来のものにAIのchatbotが組み込まれたというパターンが多い。
Learn Japanese Language with Memrise https://www.memrise.com/en/learn-japanese
Reddit でのAIツールスレ
Any recommendations for ai programs like chatgpt for learning japanese? : r/LearnJapanese https://www.reddit.com/r/LearnJapanese/comments/11zwr2g/any_recommendations_for_ai_programs_like_chatgpt/
結局、ChatGPTのイイやつがベストでは、という結論が多い。
以下のようなものも紹介されている。
Kaizen Languages - GaijinPot Study https://study.gaijinpot.com/e-learning/app/kaizen-languages/
Learn Japanese - TalkPal https://talkpal.ai/learn-japanese/
Jouzu Speak | Your Personal AI Japanese Tutor https://www.jouzuspeak.com/
英語
中国語
I tried four AI chatbots for Chinese language practice, here're my observations : r/ChineseLanguage https://www.reddit.com/r/ChineseLanguage/comments/15le8kj/i_tried_four_ai_chatbots_for_chinese_language/
□ 総合
ChatGPT・AI の教育関連情報まとめ│Lui Yoshida Lab https://edulab.t.u-tokyo.ac.jp/chatgpt-ai-resources/
OpenAIによる教師向けガイド Teaching with AI https://openai.com/blog/teaching-with-ai
□ 商用利用可能なLLMのリスト
GitHub - eugeneyan/open-llms: 📋 A list of open LLMs available for commercial use. https://github.com/eugeneyan/open-llms
□ 日本語関連
Japanese Chatbot Arena Leaderboard - a Hugging Face Space by yutohub https://huggingface.co/spaces/yutohub/japanese-chatbot-arena-leaderboard
□ 教師向け
ChatGPT等の生成系AI利用に関する留意事項(教員向け) https://olg.cds.tohoku.ac.jp/forstaff/ai-tools
今話題のChatGPTとは?~教職員のためのChatGPT入門~ https://www.oge.saga-u.ac.jp/dsci/fdsd/
□ ローカル上でやる際のツールなど
GitHub - janhq/awesome-local-ai: An awesome repository of local AI tools https://github.com/janhq/awesome-local-ai
□ リンク集
生成AIに関するリンク集 | 生成AI教育ガイド | 私たちの取り組み | 大阪大学 全学教育推進機構 教育学習支援部 https://www.tlsc.osaka-u.ac.jp/project/generative_ai/link_ai.html
□ やや専門的
松尾研究所テックブログ | Zenn https://zenn.dev/p/mkj
以下の「ICT関連」リストにAIに時々追加しています。
https://twitter.com/i/lists/1710515602102858182
→ AI関連企業や研究者、自然言語処理の研究者、関係者などが多いです。
Hugging Face – The AI community building the future. https://huggingface.co/
AI関係を検索するとよく出てくるサイト。AI・機械学習に特化したGitHub的な(スクリプトのアーカイブコミュニティ的な)場所です。文字起こしサービスのWhisper Webのように、ここで動作サンプル、テスト的に、あるいは公開場所として実際に動かしているAIのサービスもあります。
画像AIを調べると必ず出てくる謎のサイト「Hugging Face」ってナニモノ? 正体は急成長中の“ユニコーン”(1/3 ページ) - ITmedia NEWS https://www.itmedia.co.jp/news/articles/2302/23/news080.html
「プロ驚き屋」の意味と英訳(2023年 新語ネットスラング) - 言葉を嗜む - 日英翻訳辞典 https://takashionary.com/ja/pro-odorokiya-meaning/
GPT-4 APIがやってきた!3.5と“性能”を比較する|shi3z https://note.com/shi3zblog/n/n2d900e07b8ab
驚き屋的な文章例 https://chat.openai.com/share/b0e5c93e-3a9e-4952-975e-541418d21b64
時々小説や映画でみるタイプの人達、名前があったような…とClaude3に尋ねたら教えてくれました。
「チャルラターノ」(イタリア語: ciarlatano)または「チャーラタン」(英語: charlatan)
ciarlatano1.pngciarlatano2.pngciarlatano3.pngciarlatano4.png
| このWikiについて | Archive | About us |
© 2018 webjapanese.com