<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>OCR &#8211; デジタル未来 (Dejitaru Mirai)</title>
	<atom:link href="https://dejitarumirai.com/tag/ocr/feed" rel="self" type="application/rss+xml" />
	<link>https://dejitarumirai.com</link>
	<description></description>
	<lastBuildDate>Fri, 07 Mar 2025 02:59:03 +0000</lastBuildDate>
	<language>ja</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=6.8.1</generator>
	<item>
		<title>MistralがPDF文書をAI準備済みMarkdownファイルに変換する新APIを発表</title>
		<link>https://dejitarumirai.com/archives/3796</link>
					<comments>https://dejitarumirai.com/archives/3796#respond</comments>
		
		<dc:creator><![CDATA[deji]]></dc:creator>
		<pubDate>Fri, 07 Mar 2025 02:59:03 +0000</pubDate>
				<category><![CDATA[記事]]></category>
		<category><![CDATA[AI]]></category>
		<category><![CDATA[Markdown]]></category>
		<category><![CDATA[Mistral]]></category>
		<category><![CDATA[OCR]]></category>
		<category><![CDATA[PDF]]></category>
		<guid isPermaLink="false">https://dejitarumirai.com/?p=3796</guid>

					<description><![CDATA[フランスの大規模言語モデル開発企業Mistralが、複雑なPDF文書を扱う開発者向けに新しいAPI「Mistral OCR」を発表しました。これは、光学文字認識（OCR）を利用してPDFをテキストファイルに変換し、AIモデルが情報を容易に取り込めるようにするものです。LLM（大規模言語モデル）が支え]]></description>
										<content:encoded><![CDATA[<p>フランスの大規模言語モデル開発企業Mistralが、複雑なPDF文書を扱う開発者向けに新しいAPI「Mistral OCR」を発表しました。これは、光学文字認識（OCR）を利用してPDFをテキストファイルに変換し、AIモデルが情報を容易に取り込めるようにするものです。LLM（大規模言語モデル）が支える人気の生成AIツールであるOpenAIのChatGPTなどは、基本的に生のテキストを用いて動作します。そのため、AIワークフローを構築したい企業にとって、データをクリーンな形式で保存・インデックス化することが極めて重要です。Mistral OCRは、多くのOCR APIとは異なり、多様な形式を認識できるため、テキストと画像が交じり合った文書でも、グラフィカルな要素を適切に出力します。出力形式はMarkdownで、開発者がリンクや見出しなどをテキストファイルに簡単に追加できるものです。Markdownは、多くのLLMのトレーニングデータセットで重要な役割を果たしており、AIアシスタントアプリがリッチテキスト出力に整形する際に広く使用されています。Mistralの共同設立者であるギヨーム・ランプルは、「企業はこれまで、PDFやスライド形式の数多くの文書を抱えており、LLM、特にRAGシステムにアクセスできない状態でした。Mistral OCRを使用することで、顧客は豊かで複雑な文書を、全ての言語で可読なコンテンツへと変換できます」とのことです。また、Mistral OCRは、AWS、Azure、Google Cloud Vertexなどのクラウドパートナーや、MistralのAPIプラットフォーム上で利用可能です。機密データを扱う企業向けにはオンプレミス展開も提供しています。パリに本社を置くこのAI企業によれば、Mistral OCRはGoogle、Microsoft、OpenAIのAPIと比較して性能が優れているとされています。高度なレイアウトや数学的表現を含む複雑な文書でもテストを行い、英語以外のドキュメントについても高いパフォーマンスを発揮します。Mistral OCRは、特定の機能に特化しているため、迅速な処理が期待できます。競合するGPT-4oモデルとは異なり、MistralはOCR機能専用に設計されているため、開発者向けの利便性も高いです。企業向けには、法務文書を扱う法律事務所など、多くのユースケースが考えられています。RAGは、生成AIモデルとコンテキストとして使用されるデータを取得するための技術であり、Mistral OCRは将来的な文書処理の効率化を見込んでいるのです。</p>
<p><img src='https://dejitarumirai.com/wp-content/uploads/2025/03/mistralpdfaimarkdownapi-2.webp' alt='MistralがPDF文書をAI準備済みMarkdownファイルに変換する新APIを発表' /></p>
]]></content:encoded>
					
					<wfw:commentRss>https://dejitarumirai.com/archives/3796/feed</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
			</item>
		<item>
		<title>MICROSOFT PHOTOS の新機能で写真が生まれ変わる！</title>
		<link>https://dejitarumirai.com/archives/2184</link>
					<comments>https://dejitarumirai.com/archives/2184#respond</comments>
		
		<dc:creator><![CDATA[deji]]></dc:creator>
		<pubDate>Wed, 23 Oct 2024 00:57:32 +0000</pubDate>
				<category><![CDATA[AIツール]]></category>
		<category><![CDATA[Copilot+]]></category>
		<category><![CDATA[Microsoft]]></category>
		<category><![CDATA[OCR]]></category>
		<category><![CDATA[スーパ解像度]]></category>
		<guid isPermaLink="false">https://dejitarumirai.com/archives/2184</guid>

					<description><![CDATA[Microsoftが新しいCopilot+デバイスに向けて、革新的なAIツールのアップデートを発表しました。待望の「スーパ解像度」機能がInsidersビルドに搭載され、SnapdragonのNPU（ニューラルプロセッシングユニット）が活用されることになりました。Windows Insiderブログ]]></description>
										<content:encoded><![CDATA[<p>Microsoftが新しいCopilot+デバイスに向けて、革新的なAIツールのアップデートを発表しました。待望の「スーパ解像度」機能がInsidersビルドに搭載され、SnapdragonのNPU（ニューラルプロセッシングユニット）が活用されることになりました。Windows Insiderブログによると、プレビュー版の利用者は、スーパ解像度機能を使用して画像を最大8倍に補正し、よりクリアで高品質な写真を楽しむことができます。特に低解像度の写真や、大きな印刷用の画像、細部を強調したいときに便利です。</p>
<p>この機能の大きな利点は、全ての処理がローカルで行われるため、プライバシーの懸念を払拭できる点です。また、Photosアプリには光学文字認識（OCR）機能も追加され、画像内のテキストをスキャンし、コピー＆ペースト可能な形式に変換することができます。これにより、文書の写真から簡単にテキストを抽出することができ、書き写す手間を省くことができます。</p>
<p>新機能を試すには、Copilot+デバイスでInsiderビルドに登録し、Microsoft StoreからPhotosをバージョン2024.11100.17007.0以上にアップデートする必要があります。アップデート後、新しい機能を即座に体験することができます。<br />
今後もさらなる機能強化が期待される中、Microsoftの取り組みには目が離せません。</p>
]]></content:encoded>
					
					<wfw:commentRss>https://dejitarumirai.com/archives/2184/feed</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
			</item>
	</channel>
</rss>
