PHP htmlspecialchars() 函数用法及示例

   PHP String 字符串函数手册

    htmlspecialchars()函数用于将特殊字符转换为 HTML 实体。

语法

string htmlspecialchars ( string $string [, int $flags = ENT_COMPAT | ENT_HTML401 [, string $encoding = ini_get("default_charset") [, bool $double_encode = true ]]] )

定义和用法

用于将特殊字符转换为 HTML 实体

返回值

它返回转换后的字符串(string)。
如果指定的编码 encoding 里, string 包含了无效的代码单元序列, 没有设置 ENT_IGNORE 或者 ENT_SUBSTITUTE 标记的情况下,会返回空字符串。

预定义的字符是:

  • & (和号)成为 &

  • " (双引号)成为 "

  • ' (单引号)成为 '

  • < (小于)成为 &lt;

  • > (大于)成为 &gt;

注意:要把特殊的 HTML 实体转换回字符,请使用 htmlspecialchars_decode() 函数。

参数

序号参数和说明
1

string

必需。它包含有关输入字符串的信息

2

flags

可选。指定如何处理引号、无效的编码以及使用哪种文档类型。

可用的引号类型:

  • ENT_COMPAT - 默认。仅编码双引号。

  • ENT_QUOTES - 编码双引号和单引号。

  • ENT_NOQUOTES - 不编码任何引号。

无效的编码:

  • ENT_IGNORE - 忽略无效的编码,而不是让函数返回一个空的字符串。应尽量避免,因为这可能对安全性有影响。

  • ENT_SUBSTITUTE - 把无效的编码代替成一个指定的带有 Unicode 代替字符 U+FFFD(UTF-8)或者 &#FFFD; 的字符,而不是返回一个空的字符串。

  • ENT_DISALLOWED - 把指定文档类型中的无效代码点代替成 Unicode 代替字符 U+FFFD(UTF-8)或者 &#FFFD;。

指定使用的文档类型的附加 flags:

  • ENT_HTML401 - 默认。作为 HTML 4.01 处理代码。

  • ENT_HTML5 - 作为 HTML 5 处理代码。

  • ENT_XML1 - 作为 XML 1 处理代码。

  • ENT_XHTML - 作为 XHTML 处理代码。

3

encoding

它是一个可选参数,定义了转换字符时使用的编码。

允许的值:

  • UTF-8 - 默认。ASCII 兼容多字节的 8 位 Unicode

  • ISO-8859-1 - 西欧

  • ISO-8859-15 - 西欧(加入欧元符号 + ISO-8859-1 中丢失的法语和芬兰语字母)

  • cp866 - DOS 专用 Cyrillic 字符集

  • cp1251 - Windows 专用 Cyrillic 字符集

  • cp1252 - Windows 专用西欧字符集

  • KOI8-R - 俄语

  • BIG5 - 繁体中文,主要在台湾使用

  • GB2312 - 简体中文,国家标准字符集

  • BIG5-HKSCS - 带香港扩展的 Big5

  • Shift_JIS - 日语

  • EUC-JP - 日语

  • MacRoman - Mac 操作系统使用的字符集

注意:在 PHP 5.4 更早版本,无法被识别的字符集将被忽略并由 ISO-8859-1 代替。自 PHP 5.4 起,无法被识别的字符集将被忽略并由 UTF-8 代替。

4

double_encode

一个指定了是否编码已存在的 HTML 实体的布尔值。
  • TRUE - 默认。将对每个实体进行转换。

  • FALSE - 不会对已存在的 HTML 实体进行编码。

在线示例

试试下面的实例,将预定义的字符转换为 HTML 实体:

<?php
   //将预定义的字符转换为 HTML 实体,编码双引号和单引号
   $input = htmlspecialchars("<a href=''>nhooo</a>", ENT_QUOTES);
   echo $input;
?>
测试看看‹/›

输出结果-

<a href=''>nhooo</a>

PHP String 字符串函数手册