AI時代のLinuxの用語集（22語）

AI時代のLinuxに関する Linux 用語を、読み・意味・補足つきでまとめました。

AIエージェントえーあいえーじぇんと

目的達成のために道具を自分で選び、繰り返し使いながら作業を進めるAIの仕組み。

会話文を返すだけのチャットAIと異なり、ファイル操作やコマンド実行などの道具（ツール）を状況に応じて自分で選び、その結果を見て次の行動を判断するというループを自律的に回す。Claude Codeはこの考え方をターミナル上で実現したAIコーディングエージェントの一例。

CUDAくーだ

NVIDIA GPUに計算をさせるための共通の土台。AIライブラリが内部で使う。

GPUを汎用計算に使うためのNVIDIAの仕組み。PyTorchなどのAIライブラリはCUDAを通してGPUを動かす。物理GPU→ドライバ→CUDA→AIプログラムという層をなし、どれか欠けると計算は走らない。ドライバとのバージョン対応があるため、公式の対応表で組み合わせを確認する。

dry-runどらいらん

実際には変更を加えず、実行した場合に何が起きるかだけを事前に表示する試し実行のこと。

「乾いた実行」の意味で、水を使わない予行演習になぞらえた呼び方。多くのコマンドやツールが --dry-run のようなオプションで対応しており、対象ファイルの一覧や変更予定の内容を安全に確認できる。専用オプションがない場合でも、削除コマンドを echo に置き換えて対象を先に確認する、といった代用の工夫がよく使われる。

GPUクラスタじーぴーゆーくらすた

GPUを積んだサーバーを多数束ね、1つの巨大な計算資源として扱う仕組み。

GPU（画像処理用の演算チップ）を搭載したサーバーを、ネットワークで多数連結して構成する計算基盤。個々のサーバーが協調して動くことで、1台では到底こなせない規模の計算を短時間で処理できる。AIモデルの学習や大量の問い合わせへの応答など、AIの計算基盤の中核を担っており、構成するサーバー群のOSには主にLinuxが使われる。

GPUサーバじーぴーゆーさーば

AIの計算のためにGPUを積んだLinuxサーバ。1台に複数枚積むこともある。

AIの学習・推論を担う、GPUを搭載したサーバ。同じ計算を大量に並列化できるGPUの特性がAIと相性が良い。クラウドのGPUインスタンスや自前のマシンなどがあり、nvidia-smiで状態を確認しながら運用する。土台の運用知識はふつうのLinuxサーバと共通。

LLMえるえるえむ

大量の文章データを学習し、人間のような文章を生成できるAIモデルのこと。

Large Language Model（大規模言語モデル）の略。膨大な文章データを学習することで、文脈に応じた自然な文章の生成や質問への応答ができるようになったAIの一種。ChatGPTやClaudeのようなAIチャットサービスは、このLLMを中核の仕組みとして使っている。学習にも利用時の計算にも大量の計算資源を要するため、裏側では多数のサーバーが動く。

MCPえむしーぴー

AIとツール（ファイル・DB・APIなど）をつなぐオープンな共通規格。Model Context Protocolの略。

AIクライアントが外部の道具（MCPサーバー）を呼び出すための、統一された会話の作法を定めた規格。2024年にAnthropicが公開し、特定企業に閉じないオープンな仕様として広まっている。この規格に対応してさえいれば、どのAIクライアントからでも同じ作法でMCPサーバーを利用できる。

エッジAIえっじえーあい

AIの推論をクラウドではなく手元の機器で行う考え方。

カメラやセンサーなどデータが生まれる場所（エッジ）に近い機器の中で、AIモデルによる推論を完結させるアプローチ。低遅延・プライバシー保護・通信費の削減・オフライン動作といった利点があり、ラズパイのような小型機器と軽量な推論ランタイムの組み合わせでよく実現される。

サンドボックスさんどぼっくす

外部の影響を受けず、失敗しても本体に被害が及ばない隔離された実行環境のこと。

語源は子供が安全に遊べる砂場。コンテナや仮想マシン、専用ディレクトリなどを使って、AIエージェントや未知のプログラムの活動範囲を区切る手法を指す。中で何が起きてもホスト側の環境には影響しないため、思い切った試行錯誤がしやすくなる。

ハルシネーションはるしねーしょん

AIが事実でない内容を、もっともらしく自信を持って答えてしまう現象。

生成AIが学習データにない情報や誤った情報を、あたかも正しい事実であるかのように出力してしまう性質を指す。存在しないコマンドオプションや古い仕様を断定的に答えることがあるため、重要な操作の前には man や公式ドキュメント、実機での検証と組み合わせて裏取りする習慣が欠かせない。

プロンプトぷろんぷと

AIに与える質問や指示の文章。書き方次第で回答の質が変わる。

AIチャットやAIエージェントに入力する質問・指示の文字列のこと。状況の詳細（エラー全文や目的）を含めるほど、AIは的確な回答を返しやすい。曖昧な一言よりも、背景・やりたいこと・実際に出た文字列をセットで伝えるプロンプトのほうが精度が上がる。

ローカルLLMろーかるえるえるえむ

クラウドではなく自分のマシン上で動かす大規模言語モデルのこと。

LLM（大規模言語モデル）を、外部のクラウドサービスに頼らず手元のLinuxマシンなどで直接実行する形態を指す。通信不要で使え、入力内容が外部に送信されないためプライバシー面で有利だが、動作にはマシン自体のメモリと処理性能が必要になる。

許可プロンプトきょかぷろんぷと

AIエージェントがファイル変更やコマンド実行など実際に影響のある操作を行う前に、ユーザーへ確認を求める仕組み。

エージェントは操作の内容を提示したうえで実行の可否をユーザーに委ね、承認されるまでその操作を実行しない。エージェントに調査や提案を任せつつ、実際に変更が生じる瞬間は必ず人の判断を経由させるための安全弁として機能する。

検証する力けんしょうするちから

AIの答えを鵜呑みにせず、実機や一次情報で確かめて正誤を見抜く力。

AI時代に価値が上がったスキル。AIはもっともらしい誤り(ハルシネーション)を混ぜることがあるため、manやヘルプ、実機での実行で裏を取る習慣が要る。仕組みの理解があるほど検証は速く正確になる。『AIに指示し、結果を検証できる人が強い』の核心。

行動の語彙こうどうのごい

rmやcpのように、やりたい動作とコマンド名がほぼ一対一で対応している言葉の集まり。

CLIのコマンド名は、削除ならrm、複製ならcpというように具体的な操作と強く結びついている。この対応がはっきりしているため、人間がAIに依頼するときもAIが提案するときも意味がぶれにくく、自然な文章による曖昧な依頼よりも解釈の余地が小さくなる。

自動化の主体じどうかのしゅたい

AIを受け身で使うのではなく、自分の自動化に部品として組み込む立場。

AIを『使うだけ』でなく『動かす側』に回る考え方。cronからAIに要約させる、スクリプトでローカルLLMを呼ぶ、エージェントに定型作業を任せるなど、主体は人間でAIを道具として組み込む。Linuxの自動化スキルとAIが合流する、これからの働き方の中心。

実行確認ループじっこうかくにんるーぷ

AIがコマンドを実行し、その結果の文字を読んで次の行動を決める一連の繰り返し。

指示を受け取る、コマンドを選ぶ、実行する、結果の文字を読んで判断する、という4つの動きが輪になって繰り返される流れを指す。結果がテキストで返るCLIだからこそAI自身がこの輪を回しやすく、想定と違えばオプションや手順を変えて再実行できる。GUI操作では結果の確認が難しく、この輪を作りにくい。

推論サーバすいろんさーば

学習済みAIモデルを載せ、問い合わせに答える形で提供するサーバ。

訓練を終えたモデルを『使える状態』にして、HTTPなどで問い合わせを受け付けるサーバ。ポート・リバースプロキシ・TLS・監視といった、一般的なサーバ運用の知識がそのまま効く。学習はクラウドの大型GPU、推論は用途に応じたサーバ、と役割を分けることが多い。

推論ランタイムすいろんらんたいむ

学習済みモデルを読み込み、実際の計算を実行するソフトウェア。

AIモデルというデータを受け取り、限られたCPU・メモリ・GPUなどの計算資源の上で効率よく推論処理を実行するためのソフトウェア基盤。ONNX Runtime・LiteRT（旧TensorFlow Lite）・llama.cpp系などが代表例で、動かす機器や用途に応じて適したランタイムを選ぶ必要がある。

標準入出力接続ひょうじゅんにゅうしゅつりょくせつぞく

MCPサーバーとクライアントを、標準入力・標準出力の経路でつなぐ代表的な接続方式。

プログラムがキーボードから受け取る標準入力と、画面へ出す標準出力を使って、クライアントとMCPサーバーというプログラム同士をつなぐ方式。Linuxのパイプでプログラムをつなぐ考え方の延長にあり、両者の間でJSON形式のメッセージが行き来する。MCPの接続方式にはこれ以外の方式も存在する。

量子化りょうしか

モデル内部の数値の精度を落として、ファイルサイズと必要メモリを軽くする手法。

AIモデルが持つ大量の数値パラメータを、より少ないビット数で表現し直すことで、モデル全体のサイズと実行時に必要なメモリ量を削減する技術。軽量化と引き換えにわずかな精度低下が起こりうるが、多くの用途では実用上の差は小さいとされる。

量子化りょうしか

AIモデルの内部数値の精度を落として、サイズと計算量を小さくする工夫。

学習済みモデルが内部で扱う数値の表現精度を意図的に下げることで、モデルのファイルサイズと推論にかかる計算量を削減する技術。精度はわずかに低下するが、非力なCPUやメモリの少ない組込み機器でも現実的な速度で動かせるようになるため、エッジAIでは広く使われる。

▶ 学習アプリで「引く」を使う