CentOS で LibreOffice を使用してドキュメント形式を変換する方法

CentOS で LibreOffice を使用してドキュメント形式を変換する方法

プロジェクト要件では、アップロードされたドキュメントの前処理が必要です。ユーザーが doc 形式でドキュメントをアップロードした場合、後続のプロセスでドキュメントのコンテンツを抽出できるように、docx または pdf 形式に処理する必要があります。

最初にphpoffice/phpwordパッケージを試してみましたが、ドキュメントの変換が理想的ではないことがわかりました。このパッケージは、ドキュメントの変換よりもコンテンツに基づいてドキュメントを生成するのに適していますが、私のニーズにはあまり適していません。

そんな時に、オープンソースツールのLibreOfficeを発見しました。使ってみて、とても効果的であることがわかったので、皆さんにシェアしたいと思います。

サーバーは CentOS7 です。yum を使用して LibreOffice を直接インストールします。約 600MB 以上のディスク容量が必要です。

# 以前にインストールされないように、インストール前に削除することができます。yum remove libreoffice-*
yum で libreoffice をインストール

インストールが完了するのを待った後、バージョンを確認します。公式バージョンは 6.1 ですが、yum パッケージは 5.3.6 のままですが、使用に問題はありません。ここでも、独自の Linux システム パッケージ管理ツールを使用してインストールすることをお勧めします。これにより、多くの手間を省くことができます。

[root@localhost /]# soffice --version
LibreOffice 5.3.6.1 30 (ビルド: 1)

使い方がわからない場合は、soffice --help を使用してヘルプを参照できます。パラメータと使用例はたくさんあります。フォーマット変換は非常に簡単です。

soffice --headless --convert-to docx /opt/upload/source/123.doc --outdir /opt/upload/source

上記のコマンドは、 /opt/upload/source/123.doc upload/source/123.doc ファイルを docx 形式に変換し、/ opt/upload/sourceフォルダーに出力します。

デフォルトでは:

  1. 出力ファイルはソースファイル名 + 新しい拡張子で保存されます。
  2. outdir 内の同じ名前の既存のファイルを上書きします。

変換が成功すると、次のような出力が表示されます。

フィルターを使用して /opt/upload/source/123.doc -> /opt/upload/source/123.docx に変換: MS Word 2007 XML
上書き: /opt/upload/source/123.docx

LibreOffice はファイル形式に応じて自動的にフォーマットフィルターをマッチングします。サポートされるフォーマットについては、公式 Web サイトを参照してください。

要約する

以上が、CentOS で LibreOffice を使用してドキュメント形式の変換を実現する方法についての編集者による紹介です。皆様のお役に立てれば幸いです。ご質問がございましたら、メッセージを残していただければ、すぐに返信いたします。また、123WORDPRESS.COM ウェブサイトをサポートしてくださっている皆様にも感謝申し上げます。
この記事が役に立ったと思われた方は、ぜひ転載していただき、出典を明記してください。ありがとうございます!

以下もご興味があるかもしれません:
  • Linux システムで Centos7 を使って ElasticSearch ミドルウェアと共通インターフェースを構築するデモ
  • Centos7 で ZooKeeper3.4 ミドルウェアを構築するための一般的なコマンドの概要

<<:  mysql8.0 Windows x64 zip パッケージのインストールと構成のチュートリアル

>>:  Vueで親子コンポーネント通信を実装する方法

推薦する

XHTML CSSを使用して正式なブログを書く

ブログの正式名称は「Web log」で、中国語で「ネットワークログ」を意味します。後にブログに短縮さ...

MySqlのインストールとログインの詳細な説明

LinuxにMySQLがすでにインストールされているかどうかを確認する sudo service m...

Dockerイメージが消える問題を解決する

1. 50と93では鏡像が消える [root@h50 /]# df -h ファイルシステムの使用済み...

Vue はネストされたルーティングメソッドの例を実装します

1. ネストされたルーティングはサブルーティングとも呼ばれます。実際のアプリケーションでは、通常、ネ...

HTML タグでの this の使用法の紹介

例えば:コードをコピーコードは次のとおりです。 <html> <ヘッド> &...

Jsモジュール化の動作原理とソリューションの詳細な説明

目次1. モジュラーコンセプト2. モジュール化3. モジュール化プロセス1. 通常の記述(グローバ...

HTMLで特殊記号を表示する(特殊文字対応表付き)

問題の再現HTML を使用して編集する場合、特殊記号によってエラーが表示されることが多く、極端な場合...

Dockerコンテナの紹介

Dockerの概要Docker はオープンソースのソフトウェア展開ソリューションです。 Docker...

HTML DOM入門_PowerNode Javaアカデミー

DOMとは何ですか? JavaScript を使用すると、HTML ドキュメント全体を再構築できます...

シンプルなログインページを実装するための HTML+jQuery

目次導入公開コード(バックエンドインターフェース)例 1: 最もシンプル (純粋な HTML)コード...

Vue命令の動作原理と実装方法

Vue の紹介現在のビッグフロントエンドの時代は、混乱と衝突の時代です。世界は多くの派閥に分かれてお...

OR キーワードを使用した MySql 複数条件クエリ ステートメント

前の記事では、And キーワードを使用した MySql の複数条件クエリ ステートメントを紹介しまし...

MySQLレジストリをクリアする方法

具体的な方法: 1. [ win+r ] を押して実行ウィンドウを開き、「regedit」と入力して...

ベスト HTML/CSS デザインおよび開発フレームワーク 15 選を紹介します

プロフェッショナルな Web デザインは複雑で時間がかかります。 HTML と CSS フレームワー...

マークアップ言語 - テキストの CSS スタイルを指定する

123WORDPRESS.COM HTML チュートリアル セクションに戻るには、ここをクリックして...