Apache Tika XML外部实体注入漏洞

【高危】Apache Tika XML外部实体注入漏洞

漏洞描述

Apache Tika 是一款开源的 Java 工具包,主要用于从各种文档格式中提取元数据与结构化文本内容。
受影响版本中,XMLReaderUtils.java 的 getXMLInputFactory() 方法未安全初始化 XMLInputFactory,未禁用外部实体解析。攻击者可通过恶意 PDF 中的内嵌 XFA 触发解析器访问外部资源,导致 XXE 攻击。
修复版本在 XMLReaderUtils.java 的 getXMLInputFactory() 方法中,创建 XMLInputFactory 实例后强制将 IS_SUPPORTING_EXTERNAL_ENTITIES 和 SUPPORT_DTD 设为 false,从根本上禁用外部实体和 DTD,防止XXE漏洞

MPS编号 MPS-us8m-5zq7
CVE编号 CVE-2025-54988
处置建议 建议修复
发现时间 2025-08-21
利用成本
利用可能性
是否有POC

影响范围

影响组件 受影响的版本 最小修复版本
org.apache.tika:tika-parser-pdf-module [1.13, 3.2.2) 3.2.2
org.apache.tika:tika-core [1.13, 3.2.2) 3.2.2

参考链接

https://nvd.nist.gov/vuln/detail/CVE-2025-54988

https://github.com/apache/tika/commit/94acef2854eed07f0ded357c13a659409495ca49

https://lists.apache.org/thread/8xn3rqy6kz5b3l1t83kcofkw0w4mmj1w

https://www.oscs1024.com/hd/MPS-us8m-5zq7

排查方式

手动排查

检查依赖版本:查看项目中org.apache.tika:tika-parser-pdf-module和tika-core版本是否在[1.13, 3.2.2);确认风险:若版本在范围内,存在XXE漏洞风险;修复建议:升级至3.2.2或更高版本。

一键自动排查全公司此类风险

墨菲安全为您免费提供一键排查全公司开源组件漏洞&投毒风险服务,可一键接入扫描全公司的代码仓库、容器镜像仓库、主机、制品仓库等。

试用地址:https://www.murphysec.com/adv?code=HVXL

提交漏洞情报:https://www.murphysec.com/bounty

处置方式

应急缓解方案

  1. 限制Tika服务处理不可信来源的PDF文件,对所有输入文档进行严格的来源验证
  2. 在应用层实现文件类型过滤,仅允许处理必要业务的文档类型,临时禁用PDF文件解析功能
  3. 配置网络访问控制策略,限制Tika服务进程的网络出站连接,阻止外部实体解析请求
  4. 部署Web应用防火墙(WAF),配置XXE攻击特征规则,拦截包含恶意XFA内容的PDF文件

根本修复方案

  1. 将受影响组件升级至安全版本:
  2. org.apache.tika:tika-parser-pdf-module 升级至3.2.2或更高版本
  3. org.apache.tika:tika-core 升级至3.2.2或更高版本
  4. 修改Maven项目依赖配置文件(pom.xml),更新Tika相关组件版本号
  5. 执行依赖更新命令:mvn clean dependency:purge-local-repository && mvn install
  6. 重启应用服务使版本更新生效
  7. 通过版本验证命令确认升级结果:mvn dependency:tree | grep org.apache.tika
(0)
上一篇 2025年8月21日 上午11:57
下一篇 2025年8月26日 下午2:50

相关推荐

  • Deno socket 会话数据污染漏洞 (CVE-2024-27935)

    漏洞类型 对错误会话暴露数据元素 发现时间 2024-03-21 漏洞等级 高危 MPS编号 MPS-4dbm-51vn CVE编号 CVE-2024-27935 漏洞影响广度 一般 漏洞危害 OSCS 描述 Deno 是开源的一个简单、现代且安全的 JavaScript 和 TypeScript 运行环境。 在 Deno 的 Node.js 兼容运行环境中…

    2024年3月25日
    0
  • Apache Ambari < 2.7.8 XXE注入漏洞 (CVE-2023-50380)

    漏洞类型 XXE 发现时间 2024-02-28 漏洞等级 高危 MPS编号 MPS-2950-d3zu CVE编号 CVE-2023-50380 漏洞影响广度 小 漏洞危害 OSCS 描述 Apache Ambari 是一个用于配置、管理和监控 Apache Hadoop 集群的工具。 Apache Ambari

    2024年2月29日
    0
  • WPS Office 远程代码执行漏洞(WPSSRC-2023-0701绕过) (MPS-qjky-hw9x)

    漏洞类型 代码注入 发现时间 2023-08-22 漏洞等级 高危 MPS编号 MPS-qjky-hw9x CVE编号 – 漏洞影响广度 广 漏洞危害 OSCS 描述 WPS Office 软件是由金山办公软件股份有限公司自主研发的一款办公软件套装。由于对 WPSSRC-2023-0701 的修复不充分,WPS Office Windows 版本…

    2023年8月23日
    0
  • ShowDoc <3.2.5 存在远程代码执行漏洞 (MPS-eafb-s8r2)

    漏洞类型 代码注入 发现时间 2024-05-28 漏洞等级 严重 MPS编号 MPS-eafb-s8r2 CVE编号 – 漏洞影响广度 漏洞危害 OSCS 描述 ShowDoc 是基于thinkPHP开发的开源文档管理系统,支持使用 Markdown 语法书写API文档、数据字典、在线Excel文档等功能。 ShowDoc 3.2.5之前版本存…

    漏洞 2024年5月30日
    0
  • Atlassian Confluence 模板注入代码执行漏洞 (CVE-2023-22527)

    漏洞类型 表达式语言注入 发现时间 2024-01-16 漏洞等级 严重 MPS编号 MPS-2023-0028 CVE编号 CVE-2023-22527 漏洞影响广度 一般 漏洞危害 OSCS 描述 Confluence 是由Atlassian公司开发的企业协作和文档管理工具。 Atlassian Confluence Data Center/Server…

    2024年1月16日
    0