Skip to main content
Document Conversion

DOC を TXT に変換する — 無料のオンラインコンバーター

オンラインで Microsoft Word ドキュメント (.doc) をプレーン テキスト (.txt) に無料で変換します。 ウォーターマークや登録を必要としない、高速かつ安全なドキュメント変換。...

またはインポート元

200万以上のファイル変換

数千人のユーザーに信頼されています

安全な転送

HTTPS暗号化アップロード

プライバシー優先

処理後にファイルを自動削除

登録不要

すぐに変換を開始

どこでも動作

あらゆるブラウザ、あらゆるデバイス

変換方法

1

Upload your .doc file by dragging it into the upload area or clicking to browse.

2

Choose your output settings. The default settings work great for most files.

3

Click Convert and download your .txt file when it's ready.

About DOC to TXT Conversion

DOC は、豊富な書式設定、画像、レイアウト情報を OLE2 複合ドキュメントに格納した Microsoft Word のバイナリ形式です。 TXT は最も単純なドキュメント形式であり、書式設定、メタデータ、埋め込みコンテンツのない純粋なテキスト文字です。 DOC を TXT に変換すると、テキスト コンテンツのみが抽出され、あらゆるプラットフォーム上のあらゆるソフトウェアで読み取り可能な軽量のファイルが生成されます。

これは文書の簡素化の最も抜本的な形式です。 DOC のすべての視覚要素 (フォント、色、サイズ、表、画像、ヘッダー、フッター、余白) は破棄されます。 残るのは、文書の純粋なテキストコンテンツであり、段落区切りで順番にレイアウトされます。 結果の TXT ファイルは通常、ソース DOC より 95 ~ 99% 小さくなります。

Why Convert DOC to TXT?

TXT ファイルは、データ交換の普遍的な分母です。 これらは、コマンドライン ツール (grep、awk、sed)、プログラミング言語 (どの言語もテキストをネイティブに読み取ります)、データベース (テキストの一括インポート)、バージョン管理システム (Git はテキストの変更を行ごとに追跡します)、および最新のドキュメント形式より前のレガシー システムで動作します。 宛先システムがプレーン テキストのみを受け入れる場合、DOC から TXT への変換が必要です。

TXT は、互換性のないシステム間でコンテンツを移行する場合に選択される形式でもあります。 Microsoft Word から静的サイト ジェネレーター、Wiki エンジン、またはカスタム CMS にコンテンツを移動するには、多くの場合、まず生のテキストを抽出してから、ターゲット システムの書式設定を適用する必要があります。 TXT は、このワークフローの最もクリーンな中間表現として機能します。

Common Use Cases

  • DOC コンテンツをコマンドライン テキスト処理ツールにインポートする
  • Git を使用してバージョン管理用のドキュメント コンテンツを準備する
  • DOC テキストを抽出してデータベースに一括ロードする
  • 電子メールまたはメッセージング用にドキュメントの軽量のテキスト コピーを作成する
  • DOC コンテンツを自動コンテンツ処理スクリプトにフィードする

How It Works

LibreOffice は DOC バイナリを開き、プレーン テキスト エクスポート フィルターを使用してテキスト コンテンツをエクスポートします。 フィルターはドキュメントの段落ストリームをたどり、書式設定された制御語、埋め込みオブジェクト、およびバイナリ メタデータを取り除きながらテキスト コンテンツを抽出します。 段落区切り文字は、プラットフォームのネイティブの行末 (Unix/Mac の場合は LF、Windows の場合は CRLF) として書き込まれます。 ソフト ハイフン、非改行スペース、その他の Word の特殊文字は、最も近いプレーンテキストの文字に変換されます。 出力エンコーディングは UTF-8 なので、国際文字が正しく保持されます。

Quality & Performance

すべてのテキストコンテンツは完全に忠実に保存されます。 損失は​​完全に構造的かつ視覚的なものです。見出しは通常のテキスト行になり、表は線形になり (通常、セルはタブで区切られます)、番号付きリストは番号付けの書式が失われ、すべての視覚要素 (画像、図形、グラフ) が省略されます。 手紙、記事、原稿など、主にテキストが流れるドキュメントの場合、TXT 出力は完全なコンテンツをキャプチャします。 表やグラフィックを含む高度にフォーマットされた文書の場合、重要なコンテキストが失われる可能性があります。

LIBREOFFICE EngineModerateMinimal Quality Loss

Device Compatibility

DeviceDOCTXT
Windows PCPartialPartial
macOSPartialPartial
iPhone/iPadPartialPartial
AndroidPartialPartial
LinuxPartialPartial
Web BrowserNoNo

Tips for Best Results

  • 1TXT は、スクリプトによって処理されるコンテンツ、データベースにインポートされるコンテンツ、またはバージョン管理で追跡されるコンテンツに最適です。
  • 2構造 (見出し、リスト、表) を保持する必要がある場合は、代わりに Markdown または HTML に変換してください。
  • 3出力エンコーディングがターゲット システムと一致していることを確認します。UTF-8 がデフォルトであり、すべての国際文字を処理します。
  • 4表を多く含むドキュメントの場合は、構造化データ抽出の代わりに CSV 変換を検討してください。
  • 5TXT 出力は DOC よりも大幅に小さくなります。これは機能であり、バグではありません。

Related Conversions

DOC を TXT に変換すると、テキスト コンテンツを可能な限り純粋に抽出できます。 書式設定のオーバーヘッドなしで生の単語が必要な場合に使用してください。

よくある質問

これらは同じ出力を生成します。 TEXT と TXT は、同じプレーン テキスト形式の異なる名前です。どちらも、書式設定されていない生のテキスト文字のみを含むファイルを生成します。
通常は 95 ~ 99% 小さくなります。 すべての書式設定、画像、バイナリ オーバーヘッドが削除されるため、2 MB の DOC ファイルは 20 ~ 50 KB の TXT ファイルを生成する可能性があります。
リスト項目のテキスト内容は保持されますが、箇条書き文字と自動番号付けは通常は保持されません。 項目はプレーンテキストの段落として表示されます。
TXT ファイルを Word で開き、DOC として保存することはできますが、元の書式はすべて失われます。 DOC → TXT → DOC の往復では、デフォルトの形式のプレーン テキスト コンテンツのみが生成されます。
これらは、UTF-8 でエンコードされた出力に保存されます。 スマート引用符、全角ダッシュ、半角ダッシュ、およびその他の印刷文字は正しく変換されます。

Related Conversions & Tools