重庆分公司,新征程启航
为企业提供网站建设、域名注册、服务器等服务
1.确保Linux系统下已经安装了Libreoffice。
网站建设哪家好,找成都创新互联公司!专注于网页设计、网站建设、微信开发、微信小程序、集团企业网站建设等服务项目。为回馈新老客户创新互联还提供了三沙免费建站欢迎大家使用!
2.关闭Libreoffice图形界面,切换到要转换的文档所在目录。
3.输入转换命令libreoffice --invisible --convert-to html 123.doc把123.doc文件转换为html文件,如果该目录下有多个doc文件全部要转换为html文件则可以使用批量转换命令libreoffice --invisible --convert-to html *.doc实现把该目录下全部doc文件转换为html。
4.用浏览器打开生成的html文件进行浏览查看。
关于更多Linux的学习,请查阅书籍《linux就该这么学》。
在 Vim 中直接进行转换文件编码,比如将一个文件转换成 utf-8格式 :set fileencoding=utf-8;
iconv 转换,iconv 的命令格式如下:输入/输出格式规范:iconv -f, --from-code=名称 原始文本编码 -t, --to-code=名称 ,比如说将一个 UTF-8 编码的文件转换成 GBK 编码 iconv -f GBK -t UTF-8 file1 -o file2
enconv 转换文件编码 比如要将一个 GBK 编码的文件转换成 UTF-8编码,操作如下 enconv -L zh_CN -x UTF-8 filename
用soffice指令进行转换。
用soffice指令效果不错,就是不能并行转换。
Linux中常常涉及到多种文档格式,如doc、txt、html、rtf等等。为了方便文件传递,就可能需要在各种格式之间进行转换。LibreOffice、Apache OpenOffice可以方便的打开多各文档格式并按需进行转换,但要一次处理大量文件或要编写进行转换时,仅用OpenOffice就难以胜任了。unoconv 利用 LibreOffice 的 UNO 接口实现了命令行文档格式转换功能,支持所有LibreOffice 支持的文件格式,为文档的批量转换提供了可能。
在linux系统下可以通过使用特定的pdf库来实现文档格式转换,参考如下方法:
import com.spire.pdf.*;
public class PDFtoWord {
public static void main(String[] args) {
//加载测试文档
PdfDocument pdf = new PdfDocument("sample.pdf");
//保存为Word
pdf.saveToFile("ToWord.docx",FileFormat.DOCX);
}
}
注意这里在程序中引入了spire.pdf.jar。