「Google Colab」で「OpenAI API」の「Vision」を試したので、まとめました。 「GPT-4 with Vision」(GPT-4V)は、画像について質問応答を行うAPIです。 現在、「gpt-4-vision-preview」と「Chat Completions API」を介してのみ、「Vision」を利用できます。「Assistant API」はサポートして ...
新卒で未経験コーダーとして働き始めて1年の私ですが、 先日APIの勉強をしてみようと思い立ち、Vision APIというAPIを利用しました。 今回は自らの復習も兼ねて、APIを実際に触れてみて得た学びをシェアしたいと思います。 本記事が私と同じような未経験 ...
高速・高精度な顔認証API「Face DB API」および施設の利用状況解析用API「People Analytics API」の提供を2025年7月より本格開始いたします。 ナブラワークス株式会社(本社:東京都港区、代表取締役:本島 昌幸、以下「Nabla Works」) は、自社が展開する映像・画像AI ...
12月3日、Googleがイメージ分析技術であるクラウド・ビジョンAPI(CloudVisionAPI)を公開した。クラウド・ビジョンAPIはグーグルフォトで採用されている技術であり、コンピューターには難しいとされている“見る”という課題を解決してくれる。 クラウド ...
OpenAIが画像の読み取りに対応したマルチモーダルAI「GPT-4 Turbo with Vision」の一般公開を開始しました。 GPT-4 Turbo with Vision is ...
AI駆動のオートメーション分野をリードするBoomi, LP.(所在地:米国ペンシルバニア州、CEO:スティーブ・ルーカス、以下、Boomi)およびBoomi株式会社(所在地:東京都渋谷区、代表取締役社長 CEO 河野 英太郎)は、Gartner®が、2025年10月13日に発表した2025年版 ...
ARスタートアップの株式会社OnePlanetにXR Engineerとして所属し、ARグラスの研究開発などを手掛けている徳山が執筆しています。Apple Vision Proの最新の動向から、開発情報など、Apple Vision Proの情報をピックアップして紹介していきます。 今回は、visionOSから使用 ...