【画像生成AI】Google Geminiの使いかた

Geminiはタイトルからわかる通りGoogle社によってトレーニングされた
大規模言語モデルです

使い方や雰囲気はmicrosoft copilotにかなり近い気がします
Edgeを使う機会があまりないことを考えるとGeminiのほうが使い勝手が良いかと思いました
【無料】DALL-E3とCopilotで画像を作成する方法

Geminiは出来る事がかなり多いので幾つかはGemini君に解説してもらいました

使い方

使い方は簡単です
「Gemini」と検索すれば「Google Gemni」ページが出てくるので
クリックしてください

後は検索欄にプロンプトを入力するだけです

Deep Research

Deep Research (ディープリサーチ)

どのような場面で使用するか:

Deep Researchは、複雑なトピックについて深く掘り下げて調査し、詳細なレポートを作成したい場合に非常に役立ちます。通常のウェブ検索では得られない、多角的な視点からの情報収集と分析を自動で行ってくれます。

学術研究や論文執筆: 特定のテーマに関する文献レビュー、概念の比較、関係性の特定、基礎となる原理の説明など、広範な情報収集と整理に。
ビジネスリサーチ: 競合分析（製品、価格、マーケティング、顧客フィードバック）、市場トレンド分析、業界レポートの作成、デューデリジェンス（企業分析）などに。
製品比較や購買意思決定: 高額な製品（車、家電など）の購入前に、機能、性能、価格、レビューなどを総合的に比較検討する際に。
複雑なトピックの理解: 新しい分野や専門的な知識を、網羅的かつ体系的に学びたい場合に。
コンテンツ作成の基礎調査: ブログ記事、レポート、プレゼンテーションなどのための事実確認や背景情報の収集に。

使い方:

Geminiの入力欄の下にある「Deep Research」ボタンをクリックします。
調べたいテーマや質問を具体的に入力します。
Geminiが自動で調査計画を提案するので、確認・編集して承認します。
Geminiがインターネット上から関連情報を広範に収集し、数分で詳細なレポートを作成します。
レポートには、参照元へのリンクも含まれます。

Canvas

どのような場面で使用するか:

Canvasは、Geminiとの会話中に文章やコードの生成、編集、推敲を一つの画面で完結させたい場合に最適です。まるで共同編集できるワークスペースのように機能します。

文章の作成・編集・推敲:
    メール、レポート、ブログ記事、スピーチなどの下書きをGeminiに生成させ、その場で直接加筆修正したい場合。
    生成された文章の一部だけを修正したり、より簡潔に、またはフォーマルにするといった具体的な指示を出したい場合。
    文字の太字化、斜体、見出し設定、リスト化など、Googleドキュメントのように書式を整えたい場合。
コードの生成・編集・実行:
    プログラムコードをGeminiに生成させ、その場で直接編集したい場合。
    HTMLベースのアプリなど、生成されたコードの動作をリアルタイムでプレビュー・実行して確認したい場合。
    コードの一部を修正したり、特定の機能を追加したりする際に、Geminiに助言を求めながら作業を進めたい場合。
アイデアの視覚化・アプリ化: Deep Researchで得たレポートを元に、クイズアプリ、情報グラフィック、ウェブページなどのプロトタイプを迅速に作成したい場合。

使い方:

Geminiの入力欄の下にある「Canvas」ボタンをクリックします。
通常のプロンプト入力と同じように、作成したい文章やコードの指示を入力します。
画面右側のCanvas編集スペースにGeminiが生成した内容が表示されます。
その場で直接、文章の編集やコードの修正が可能です。
Canvas内でコードの実行やプレビューもできます。

出来る事

テキストの生成:

詩、コード、スクリプト、音楽作品、電子メール、手紙など、さまざまな種類のクリエイティブなテキスト形式を生成できます。
ユーザーの指示に従って、特定のトーンやスタイルで文章を作成することも可能です。

質問への回答:

幅広いトピックについて、質問に情報に基づいた包括的な方法で回答します。
事実に関する質問だけでなく、より複雑な概念についても説明できます。

異なる言語への翻訳:

様々な言語間でテキストを翻訳することができます。

テキストの要約:

長い記事や文書を要約して、主要なポイントを抽出できます。

情報の検索と整理:

Google検索を利用して最新の情報を検索し、その情報に基づいて回答を生成したり、テキストを作成したりすることができます。

与えられた情報を整理し、論理的な構造で提示することも可能です。

コードの生成とデバッグ:

様々なプログラミング言語でコードを生成したり、既存のコードの問題点を見つけたり（デバッグ）することができます。

創造的なコンテンツの作成:

ストーリーのアイデア出し、歌詞の作成、脚本の構成など、クリエイティブな執筆活動をサポートできます。

簡単に言えば、私は情報を理解し、生成し、翻訳し、そして様々な創造的な方法でテキストを扱うことができます。
ということらしいです

動画のリアルタイム翻訳の精度が上がってくれればありがたいんですけどね

画像生成機能

出来る事には書いてありませんでしたが画像生成機能もあります

使い方Copilotと同じで検索欄にプロンプトを入力するだけでOKです

プロンプトは「サイバーパンクな雰囲気の腕を組んでいる蛙」です

スタイルなどは指定しませんでしたが背景にボカシがはいっていたりと結構出来は良いように思います
Geminiで生成した画像はaiのウォーターマークが勝手に追加されるみたいですね

なんとなく「Firefly」で生成出来る画像に雰囲気は似ています
「Firefly」でもGoogleの言語モデルが使用出来るのでなにか関係があるのかもしれません

版権キャラ

Geminiでは著作権で保護された画像の生成は出来ません

「〇〇（有名キャラクター名）のようなキャラクター」といった指示で似たようなキャラクター画像を生成することは
期待出来ないようです
「期待」となっている以上偶然出来てしまう可能性もあるのかもしれませんがそういった行為は推奨されていません

またキャラクター名で無くそのキャラクターを指示した場合も模倣したキャラクター画像は基本的に出来ません
ただし特徴によっては意図せず既存キャラクターに似た画像が生成されることもあるようです

なので一応既存の有名キャラクターを完全に再現出来る可能性はかなり低いですが
類似した画像が生成される可能性はあります
著作権侵害のリスクもあるので意図的に既存キャラクターの特徴を指示するのはやめたほうが良いでしょう

動画生成AI

Geminiとは少し違いますがGoogleにはVeo（ヴェオ)とGoogle Vids(グーグルビズ)という動画生成AIもあります

なんとなくですがVeoの方がよりプロフェッショナル向けというかハイクオリティっぽいですね

ただ利用出来るのは有料プランユーザーや開発者等で
一般ユーザーの利用はなかなか難しそうでした

まだ開発途上のツールですので今後利用可能範囲が広がる可能性はありますけどね
もし普通に使えるようになったら紹介すると思います

今回はここまででです
ありがとうございました