データセキュリティにも言及:
Salesforceは、「Slack」の生成AI機能「Slack AI」の提供を開始した。検索機能の拡張、チャンネルとスレッドの要約などの生成AI機能を全ての有料プランで利用できる。
80億と700億のパラメーターを持つ最初の2モデルを公開:
Metaは、大規模言語モデル「Meta Llama 3」の8Bおよび70Bパラメーターモデルを発表した。
解決!Python:
pdfminer.sixパッケージを用いて、PDFファイルからテキストや画像を抽出する方法を紹介する。
2022〜2027年の年平均成長率は95.4%に:
IDCによると、アジア太平洋地域(日本と中国を含む)では、生成AIの導入がかつてなく急速に進んでいることから、生成AI支出が2027年までに260億ドルに増加し、2022〜2027年の年平均成長率は95.4%に達する見通しだ。
AI・機械学習の用語辞典:
用語「BM25」について説明。各文書中の各単語の重要性をバランスよく評価する尺度で、主に検索クエリに最も一致する文書を特定するのに用いられる。キーワード検索以外にも、類似文書の検索やレコメンデーションにも活用できる。計算式は「(ある単語の文書間でのレア度)×(ある文書における、ある単語の出現頻度、の正規化された値)」で、正規化するための調整パラメーターを持つ、tf-idfの発展版と見なせる。
メリットも多いが、悪用リスクも:
OpenAIは音声生成モデル「Voice Engine」の小規模プレビューから得られた予備的な知見と結果を公表した。このプレビューから合成音声生成の持つ可能性と課題が浮き彫りとなった。
自動運転車の“危険シナリオ”をSTLで定式化:
NIIは、ISO 34502で示された自動運転車の「危険シナリオ群」について、その意味を数学的に定式化したと発表した。危険シナリオの曖昧さを回避し、危険シナリオを用いた安全性評価タスクの自動化と効率化を実現するとしている。
Pythonデータ処理入門:
pandasが提供するデータを格納/操作するための2種類のオブジェクト、SeriesとDataFrame。そのうちのSeriesオブジェクトを作成しながら、その基本的な特徴を紹介。
解決!Python:
math.isnan関数やnumpy.isnan関数、pandas.DataFrame.isnaメソッド、numpy.sum関数、pandas.DataFrame.sumメソッドなどを使って、非数かどうかを判断したり、多次元配列やDataFrameに含まれるNaNの数をカウントしたりする方法を紹介する。
「特定のマーケティングタスクの100%を処理できる可能性」:
IDCは生成AI(人工知能)に関する予測結果を公開した。それによると、生成AIを企業のマーケティングタスクに適用すると、生産性が40%以上向上するという。
AI搭載Surface PCを発表:
Microsoftは2024年3月に開催されたデジタルイベントで、Copilotや新しいSurface for Business、Windows Cloud PCといったデバイスを通して、顧客のビジネス全体で、AIの安全かつ効率的な活用を推進すると発表した。
生成AIを実務活用する際何を想定すべきか:
生成AI導入の最前線に立っているのは、DevOpsチームとプラットフォームエンジニアだ。生成AIが抱えるリスクを解説したり、生成AIを活用するメリットの事例として、プラットフォームエンジニアリングにおける活用事例を紹介したりする。
開発者やクラウド担当者、セキュリティ担当者、ビジネスアナリストを支援:
Google Cloudは、開発者、Google Cloudサービス、アプリケーション向けの新世代AIアシスタント「Gemini for Google Cloud」を発表した。
人間と機械の相互作用が複数のトレンドをけん引:
Gartnerは、2024年のサプライチェーンテクノロジートレンドのトップ8を発表した。2024年のトレンドの大きなテーマは、新興テクノロジーを活用したビジネスコントロールの必要性と、人間と機械の相互作用を通じた競争力の向上だ。
オンプレミスでも利用可能:
デロイト トーマツは、「特化型LLM」の開発サービスを提供開始した。クラウド提供型LLMが利用できない業種、業界に向けてオンプレミス運用可能な特化型LLMを提供することで、企業のLLMの活用を促進するという。
エンタープライズグレードのワークロードに対応、まずMicrosoft Azureで利用可能に:
Cohereは、同社のプロダクトの中で「最も強力でスケーラブル」とする大規模言語モデル「Command R+」を発表した。
機械学習入門:
「知識ゼロから学べる」をモットーにした機械学習入門連載の第2回。実践で役立つ、Pythonライブラリの基本的な使用例として、データの読み込みと加工(pandas使用)から、数値計算(NumPy使用)とデータ可視化(Matplotlib/seaborn使用)、機械学習(scikit-learnの使い方)までを体験しながら学ぼう。
新たな時系列予測モデルの必要性や、Moiraiが与える影響を解説:
Salesforceは、時系列基盤モデル「Moirai」を発表した。複数のドメイン、頻度、変数にまたがる多様な予測タスクにゼロショットで対応できる、汎用性の高い時系列予測が可能だという。
解決!Python:
exec関数を使ってモジュールのトップレベルで動的に変数を定義したり、globals関数の返す辞書を使ってグローバル変数として動的に変数を定義したりする方法と、その注意点を紹介する。
AIモデルを「Hugging Face」からワンクリックでデプロイ可能に:
Cloudflareは、AI推論を大規模にデプロイするためのプラットフォームである「Workers AI」の一般提供開始や、Hugging Faceとの提携拡大によって、ワンクリックでAIモデルを「Hugging Face」プラットフォームからグローバルにデプロイできるようになったことなどを発表した。
煎餅か昼寝かで悩むようなもんじゃ:
Claude 3とやらが登場したそうじゃのう。どれ、ワシも試してみるかいのう。
AI・機械学習の用語辞典:
用語「RLHF」について説明。人間のフィードバックを使ってAIモデルを強化学習する手法を指す。OpenAIのChatGPT/InstructGPTでは、人間の価値基準に沿うように、言語モデルをRLHFでファインチューニング(微調整)している。
AI・機械学習の用語辞典:
用語「生成AI」について説明。全く新しいオリジナルのアウトプットを生み出すAI、具体的にはデジタルの画像や動画、オーディオ(音声/音楽など)、文章やコードなどのテキストを生成するAI、もしくはこれらを組み合わせて生成するAIのことを指す。
AI・機械学習の用語辞典:
用語「tf-idf」について説明。各文書中に含まれる各単語が「その文書内でどれくらい重要か」を表す尺度で、具体的には「(ある文書における、ある単語の出現頻度)×(ある単語の文書間でのレア度)」などの計算値のこと。主に文書検索やレコメンデーションに使われている。
AI・機械学習の用語辞典:
用語「相関係数(ピアソンの積率相関係数)」について説明。相関係数とは2つの変数間の関係の強さと方向性を表す、1〜0〜-1の範囲の数値。1(強い正の相関)では、2つの変数が強く同方向に連動する。-1(強い負の相関)では強く逆方向に連動する。相関なしでは、連動しない。
AI・機械学習の用語辞典:
正規化とは、比較や分析を容易にするために、データの単位やスケールを共通の基準に整えること。単に「正規化」(Min-Max法)と言った場合は、データを最小値「0」〜最大値「1」にスケーリングすることを意味する。また、正規化の一種である標準化は、データを平均「0」、標準偏差「1」にスケーリングすることを意味する。
Pythonデータ処理入門:
Pythonでデータ処理を始めようという人に向けて、pandasとは何か、インストール、データセットの読み込みと書き込み、簡単なメソッド呼び出しまでを説明します。
2024年夏ごろをめどに1750億パラメーターのLLMを構築予定:
NIIは、「大規模言語モデル研究開発センター」を開設した。まずは、NIIが主宰しているLLM勉強会の研究開発を発展させ、1750億パラメーターのLLMを構築するという。
対話システムの歴史から見たChatGPT(3):
ChatGPTを対話システムと見なし、これまでの対話システムで用いられてきた技術との違いを整理しながら、どのようにして人間のような自然で流ちょうな対話が実現できているのかを解説する本連載。第2回では、対話システムへの入力を処理する言語理解について解説した。今回は、第1回で取り上げた対話システムを中心に、対話管理と応答文生成において用いられている技術について解説する。
解決!Python:
ファイルパスをドライブ、ルート、それ以降に分割するにはos.pathモジュールのsplitroot関数を使える。その使い方、WindowsとUNIXでの動作の違い、Windowsと同様な分割結果を得るための方法などを紹介する。
AI・機械学習の用語辞典:
生成AI時代を生きる社会人に必須の基礎知識を身に付けよう。生成AIに関する用語として「生成系AI」「大規模言語モデル(LLM)」「プロンプトエンジニアリング」「ハルシネーション」「埋め込み表現」「ベクトル検索」「ベクトルデータベース」「RAG(検索拡張生成)」「事前学習」「ファインチューニング」の10語を紹介する。代表的なチャットAIやLLM、画像生成AIについても触れる。