ChatGPTにStable Diffusion、AI遊びが楽しすぎる件について #Weekly小噺

初音ミク AIとMMD、モーション:PIP、モデル:Sour、AIモデル:Anyting 4.5

広告またはアフィリエイトを含みます。

楽しすぎてAIに時間が持ってかれてる。

テクノロジー、ガジェットに関する僕の最近の出来事や興味、不満をSEO/起承転結/需要を全無視で、思うことを思うがままブラザー(読者)にぶちまける不定期連載「Weekly小噺」ですが、今回は話題のAI「ChatGPT」と「Stable Diffusion」に関するお話。

ChatGPTは、OpenAIが開発した大規模な自然言語処理モデル。Stable Diffusionは画像生成AIのことなのですが、どちらも2023年になって進化の速度が尋常じゃないことになっていまして。

あまりにもAIの進化速度が速くて人間が追いつけていない状況なので、イーロン・マスクやスティーブ・ウォズニアックといった著名人がGPT-4以上の開発を6か月以上停止するよう求める公開書簡に署名して話題になるほど。

(書簡には誤情報の拡散や労働市場における自動化に関する懸念について挙げられていて、つまるところ…AIが人間並みの競争力を持つことが懸念されてるみたい)

ちなみに、ChatGPTは文章に関することなら"ほぼ"なんでも。Stable Diffusionはアートなイラストや記事で使う画像などをAIに作成してもらうことができますよ。

ChatGPTとStable Diffusionが楽しすぎて色々試したので…このあたりでダダっとシェアです。色々な課題はあるけど、ブログの自動化も不可能ではないかも。

ChatGPT – 公式HP

Stable Diffusion – 公式HP

ChatGPTとStable Diffusionについて簡単におさらい

Stable Diffusionで生成した画像。僕には考えもつかない構図…素敵。

それじゃ、まずはChatGPTとStable Diffusionについての簡単なおさらいから。どちらも2022年~2023年で急激に進化しているAI(人口知能)で、ChatGPTが大規模な自然言語処理のモデル。Stable Diffusionが画像生成AI。

出来ることはそれぞれ違って、例えば、Stable Diffusionは文章や画像から新しい画像を生成。ChatGPTは、質問したり、記事を作成するときに見出しを考えてもらったり、文章を作成してもらったり、題名と具体的な筋書きだけ考えて、絵本を作ってもらったり…文字に関することなら"ほぼ"なんでもできる自然言語処理モデルです。

ChatGPT

ChatGPTは、OpenAIが2022年11月に公開した大規模な自然言語処理のモデル。

膨大な量のテキストデータを学習し、質問やテキストの生成などの自然言語処理タスクを行うことができるほか、語彙の豊富さ、文法的な正確さ、人間のような応答能力が大きな特徴になっていて、稀に誤情報をあたかも真実のように語ることもあるのでファクトチェックは重要ですが、タイトルから見出し、文章まで作成してもらうこともできますよ。

ChatGPTは一般的な知識、ニュース、歴史、科学、文化、エンターテインメント、哲学などの様々なトピックに関する情報を提供してくれるほか、文章の生成や翻訳などのタスクにも利用されていて、現在の最新バージョンの言語モデルは2023年3月に公開された「GPT-4」。

GPT-3GPT-4
パラメータ数約1.75兆個約100兆個
最大トークン2,04832,768
機能自然言語による文書生成自然言語による文書生成
画像入力による文書生成
利用料無料月額$20

GPT-4を利用するには有料の"ChatGPT Plus(月額$20)"に加入する必要がありますが、無料で利用できる「GPT-3.5」と比べパラメータ数が爆発的に増加しことにより、精度の高い処理ができるほか、タスク処理、問題解決能力、理解、知識とあらゆる性能が向上。Microsoftの検索エンジン"Bing"にも導入されてます。

#Tips
ChatGPTは会話能力を持つWebアプリのAIチャットボットのこと。GPT-3やGPT-4はそれらのボットで使用される言語モデルです。

ChatGPTで出来ること

このブログの説明は…ほぼ合ってる。

せっかくなのでChatGPTで出来ることの例についてもちょこっと。ChatGPTは膨大なテキストデータを扱うことができるので、ちょっとした疑問や質問にはすぐに答えてくれますが、それだけがChatGPTの出来ることじゃなくてですね。

※ChatGPTはあくまでも"AI言語モデル"。情報の正確性を検証する能力は無いため、自分で情報の真偽を確かめる必要があることはお忘れなく。稀にものすごい嘘ぶっこんでくる。

文章を作成してもらったり、絵本を書いてもらったり、コードを出力してもらうこともできるのですが、例えば、「ブラウザで動作する音声読み上げツールを作って」と入力するとWeb Speech APIを使用してテキストを音声に変換。

speechSynthesis.speakメソッドを使用して音声を再生する…といった感じで"ちゃんと動くコード"を出力してくれます。

上記がChatGPTに作成してもらったテキスト読み上げツール。

もう少し具体的な仕様を記載してお願いすると、ポケモンの努力値カウンターなんかも作成してくれます。AIに頼むだけでコードが出てきちゃう時代。シンプルにすごい。

対策キーワードや見出しに使うキーワードを記入するとさらに精度が上がる。

当然、ChatGPTの手にかかればブログの記事の作成もお手の物。ただ、情報が正しいかどうかの"ファクトチェック"は必須で、どうしても単調で無個性な文章になってしまうため手直しは必須かなぁと。

テスト的な感じでいくつか記事を作成してみたけど、色々と課題があって完全自動化はまだ無理かもですね。ブログ運営でChatGPTを使用するなら、アイデアの手助けやツールとして付き合うほうが上手くいきそう。

ちなみに、ChatGPTは登録さえすれば無料で誰でも簡単に利用できるため、この機会に触れてみるといいかもしれません。PCだけでなく、インターネットに繋がりさえすればiPhoneでもAndroidスマホでも利用可能です。

ChatGPT – 公式HP

Stable Diffusion – 公式HP

Stable Diffusion

Stable Diffusionは機械学習技術を用いたAI画像処理ソフト。

画像の生成、ノイズ除去、修復、変換など、様々な画像処理に対応していて、文章から画像やイラストを作成してもらったり、写真から画像やイラストを作ってもらったり……触っていて"楽しさ"にダイレクトに訴えかけてくるのはこっち。

色々触ってるだけでほんとワクワクします。

英語と比べて精度は落ちるけど、日本語入力にも対応。…ほぼ実写や。

Stable Diffusionの最大の特徴はその高い処理速度と高品質な画像処理結果。

高品質な画像処理を行うためには膨大な計算量と時間が必要とされていますが、Stable Diffusionは独自のアルゴリズムにより高速で高品質な画像処理を実現してます。それも"呪文"や"プロンプト"と呼ばれる「AIに書いてほしい絵の内容を伝える文章」を入力するだけ。

「sandy beach at sunset, japan, high quality, full color」みたいな感じで文章を入力するだけで画像を生成してくれます。

それと、Stable Diffusionは「ウェブ版」とローカル環境に自分で環境を構築して使う「PC版」が用意されていて、Automatic1111などのWebUIを使用することで簡単に使うことができる…というのも大きなトピックかなぁと。

ツールさえ使いこなすことができれば誰でも使えるハードルの低さが魅力ですが、それゆえに著作権的な問題も少なからずあります。

Stable Diffusionで出来ること

Stable Diffusionのimg2img(画像から画像を生成)。

Stable Diffusionでは、様々な画像を生成することが主な機能となりますが、MacやWindowsPCにローカル環境を構築し、ツールやソフトを活用することで出来ることがググっと増えまして。

左:AI、右:MMD

例えば、僕が今夢中になっているのはMMD(MikuMikuDance)とStable Diffusionを組み合わせたAI処理で、MMDで作成したモデルとモーションを1フレームごとに分解したあと、Automatic1111の"img2img"でAI画像を生成。

AIで生成された画像を基にして、1フレームごとに分解した画像を"Batch"でまとめてAIに生成してもらって、その画像でもう一度動画を作成…みたいな。これはあくまでも一例ですが、この方法だと4000枚ほどの画像をAI処理するため結構時間かかるし…試行錯誤中です。

※今のところ、AIで生成した画像に著作権は認められていないですが、MMDで作成したモデルやモーションの著作権は作者に準じます。AIだからといって好き勝手に使って商用利用とか絶対だめ。モデルやモーションの作者に最大限の敬意と尊敬の念を込めて利用しましょう。

ちなみに、僕はAIで生成した画像を動かすにあたりめっちゃリサーチしたのですが、その過程でMMDについても存在を知って。今MMDにもハマっちゃって時間がどんどん溶けてく。(最近全然記事書けてなかった理由がコレ)

すでにStable Diffusionを活用したAI画像はデザインや映像制作業者など、様々な分野で利用されていて、それこそゲームやアニメ、ブログのアイキャッチ画像から企業ロゴまでなんでも作れちゃうので、少しでも気になるブラザーはこの機会に触れてみるといいかもしれません。

Stable Diffusion – 公式HP

ChatGPTにはブログ運営のアシスタントになってもらうことにした

そんなこんなで、ここ最近はAI(主にChatGPTとStable Diffusion)にどっぷりハマっているところですが、2023年に入ってからの進化がとにかくエグイ。

さすがに全自動で記事作ってもらって収益化…みたいなのは"まだ"無理ですが、すでにGPT-4が驚異的な正答率を誇っていますし、これも時間の問題かなぁと。僕も一人のブロガーとしてAIの脅威をひしひしと感じているところです。

(ChatGPTはあくまでも"AI言語モデル"で正確性を検証する能力がないってのが救い)

とはいえ、脅威だからと突き放すんじゃなくて、ChatGPTやStable Diffusionを筆頭にどんどん進化していくAIたちとこれから上手く付き合っていく、使いこなしていくことが重要になってくるのかなぁと。ChatGPTは正確性が重要にならないところで最大のパフォーマンスを発揮してくれるので、アイデアが湧かなくて詰んだり、意見が欲しいときに訪ねてみたり、ブログ運営のアシスタントになってもらおうかなと。

それと…最後にひとつ大事なこと。

最近はTikTokやTwitterなどのSNSで「波に乗り遅れるな!AIを活用してお金を稼ごう!」みたいな投稿も見かけるようになりましたが、こういうのは流し見するくらいで。鵜呑みにして踊らされないこと。

もちろん、とてつもなく有益な情報を公開してくれている人もいますが、大抵の場合、そういった口上で紹介されている情報はすでに市場が形成されていて付け入る隙がなかったり、ものすごく浅い、浅~いところで情報をグルグルグルグルしてるだけ。

これからはもっと情報の真偽と有益性を見極める"目"が必要になるかも。

ChatGPT – 公式HP

Stable Diffusion – 公式HP