技術ブログヘッダー

技術ブログ

最新の技術情報や導入事例、開発ノウハウを発信しています。

AI・機械学習
2分

ElyzaChatに画像生成機能を付けてみた

以前に作っていた Stable Diffusion のバッチ処理スクリプトを応用して、ElyzaChat に画像生成機能を組み込んでみた。 やってみたことはシンプルだ。 チャット画面で 「○○の画像作って」 と入力すると、Elyzaがそのテキストを理解し、 自動的に英語のプロンプトに翻訳してS...

2025/02/03 09:00
むらかみ
ElyzaChatに画像生成機能を付けてみた
以前に作っていた Stable Diffusion のバッチ処理スクリプトを応用して、ElyzaChat に画像生成機能を組み込んでみた。

やってみたことはシンプルだ。
チャット画面で

「○○の画像作って」

と入力すると、Elyzaがそのテキストを理解し、
自動的に英語のプロンプトに翻訳してStable Diffusionに送信する。
数秒後には、生成された画像がそのままチャット画面に表示される。

日本語で指示しても問題なく動くのが嬉しい。
Elyzaが裏で翻訳処理を担ってくれるので、
ユーザーは日本語だけで自然にやり取りできる。
まるで「画像が作れるAIアシスタント」と会話しているような感覚だ。

カメラと光を制御すると、一気にクオリティが上がる

試してみて感じたのは、
やはり カメラアングル や 光源設定(lighting, backlight, rim lightなど) を
きちんと指定してあげると、生成結果のクオリティが格段に上がるということ。

「可愛いぬいぐるみを撮って」だけでも十分だが、
そこに「soft studio lighting, 50mm lens, shallow depth of field」などの
カメラ的な指定を加えると、まるでプロの写真のような仕上がりになる。

Elyzaにプロンプトを作らせつつ、
Stable Diffusionに的確な条件を渡す ― この連携が非常に自然で心地いい。

今回の仕組みで、ElyzaChatは単なるテキストチャットを超えて、
「言葉から画像を生み出す対話型クリエイティブAI」へと進化した。

日本語で話しかけるだけで、翻訳・プロンプト生成・画像出力まで完結する。
手元でStable Diffusionを回しているのに、まるでWebサービスのような体験だ。

むらかみ

AI・機械学習分野の専門家として、企業のDX推進をサポートしています。