CentOS で LibreOffice を使用してドキュメント形式を変換する方法

CentOS で LibreOffice を使用してドキュメント形式を変換する方法

プロジェクト要件では、アップロードされたドキュメントの前処理が必要です。ユーザーが doc 形式でドキュメントをアップロードした場合、後続のプロセスでドキュメントのコンテンツを抽出できるように、docx または pdf 形式に処理する必要があります。

最初にphpoffice/phpwordパッケージを試してみましたが、ドキュメントの変換が理想的ではないことがわかりました。このパッケージは、ドキュメントの変換よりもコンテンツに基づいてドキュメントを生成するのに適していますが、私のニーズにはあまり適していません。

そんな時に、オープンソースツールのLibreOfficeを発見しました。使ってみて、とても効果的であることがわかったので、皆さんにシェアしたいと思います。

サーバーは CentOS7 です。yum を使用して LibreOffice を直接インストールします。約 600MB 以上のディスク容量が必要です。

# 以前にインストールされないように、インストール前に削除することができます。yum remove libreoffice-*
yum で libreoffice をインストール

インストールが完了するのを待った後、バージョンを確認します。公式バージョンは 6.1 ですが、yum パッケージは 5.3.6 のままですが、使用に問題はありません。ここでも、独自の Linux システム パッケージ管理ツールを使用してインストールすることをお勧めします。これにより、多くの手間を省くことができます。

[root@localhost /]# soffice --version
LibreOffice 5.3.6.1 30 (ビルド: 1)

使い方がわからない場合は、soffice --help を使用してヘルプを参照できます。パラメータと使用例はたくさんあります。フォーマット変換は非常に簡単です。

soffice --headless --convert-to docx /opt/upload/source/123.doc --outdir /opt/upload/source

上記のコマンドは、 /opt/upload/source/123.doc upload/source/123.doc ファイルを docx 形式に変換し、/ opt/upload/sourceフォルダーに出力します。

デフォルトでは:

  1. 出力ファイルはソースファイル名 + 新しい拡張子で保存されます。
  2. outdir 内の同じ名前の既存のファイルを上書きします。

変換が成功すると、次のような出力が表示されます。

フィルターを使用して /opt/upload/source/123.doc -> /opt/upload/source/123.docx に変換: MS Word 2007 XML
上書き: /opt/upload/source/123.docx

LibreOffice はファイル形式に応じて自動的にフォーマットフィルターをマッチングします。サポートされるフォーマットについては、公式 Web サイトを参照してください。

要約する

以上が、CentOS で LibreOffice を使用してドキュメント形式の変換を実現する方法についての編集者による紹介です。皆様のお役に立てれば幸いです。ご質問がございましたら、メッセージを残していただければ、すぐに返信いたします。また、123WORDPRESS.COM ウェブサイトをサポートしてくださっている皆様にも感謝申し上げます。
この記事が役に立ったと思われた方は、ぜひ転載していただき、出典を明記してください。ありがとうございます!

以下もご興味があるかもしれません:
  • Linux システムで Centos7 を使って ElasticSearch ミドルウェアと共通インターフェースを構築するデモ
  • Centos7 で ZooKeeper3.4 ミドルウェアを構築するための一般的なコマンドの概要

<<:  mysql8.0 Windows x64 zip パッケージのインストールと構成のチュートリアル

>>:  Vueで親子コンポーネント通信を実装する方法

推薦する

Mysql 日付クエリの詳細な紹介

現在の日付を照会する CURRENT_DATE() を選択します。 CURDATE() を選択する;...

MySQL 8.0.21 無料インストール版 設定方法 グラフィックチュートリアル

MySQLをインストールする6つの手順(インストールパッケージのみがインストール場所を選択できます)...

Centos8 でローカル Web サーバーを構築するための実装手順

1 概要システム Centos8 では、httpd を使用してローカル Web サーバーを構築します...

JavaScript で DOM 要素を監視する MutationObServer の詳細

1. 基本的な使い方これは MutationObserver コンストラクターを通じてインスタンス化...

「いいね!」文がインデックスに登録されないのはなぜですか?

序文この記事は、最も人気のある言語で最も退屈な基礎知識を説明することを目的としていますこのトピックは...

MySQLデータベースが大きすぎる場合にバックアップと復元を行う方法

コマンド: mysqlhotcopyこのコマンドは、ファイルをコピーする前にテーブルをロックし、不完...

タイプライター効果を実現する純粋な js

この記事の例では、タイプライター効果を実現するためのjsの具体的なコードを参考までに共有しています。...

最初のReactページを作成する方法

目次Rractとは何ですか?背景React スキャフォールディングJSXとは何かRractとは何です...

Flex モバイルレイアウトにおけるシングルラインレイアウトとダブルラインレイアウトの違いと使い方

レイアウトにul>liを使用した単一行レイアウトを以下に示します。 <ul class=...

HTMLタグオーバーフロー処理アプリケーション

CSSを使用してスクロールバーを変更する1.コンテンツがオーバーフローした場合のオーバーフロー設定水...

HTML テーブルタグについての簡単な説明

主にその構造といくつかの重要な特性について説明します。少しずつ改善しながら紹介していきます。 1) ...

HTML テーブル セルの幅と高さを設定する方法

Web ページを作成するときに、テーブルの幅が揃っていないという問題に遭遇することがよくあります。 ...

バッチファイルを処理するLinuxの1行コマンドの詳細な説明

序文最良の方法は、あなたが思いつく最も速い方法ではないかもしれません。職場で一時的に使用するスクリプ...

IPとポートが接続可能かどうかを検出する方法

Windows コマンドテルネット形式: telnet IP ポート場合: テルネット 191.1....

LinuxサーバーにGRUBをインストールする手順

Linux サーバーに GRUB をインストールする方法クラウド移行ツールを使用して、CentOS ...