2012年05月11日に投稿

[PHP] preg_match の正規表現の中で日本語（マルチバイト文字）を使う

正規表現の中で日本語（マルチバイト文字）を使ってマッチさせるには、パターン修飾子というものを使う必要がありました。$regex の最後に記述している小文字の u がパターン修飾子です。u は$regex を UTF-8 として扱うようになります。

<?php
    $text = '私の名前は佐藤です。';
    $regex = '/私の名前は(.+)です。/u';
    preg_match($regex, $text, $matches);

    var_dump($matches);

<?php

$text = '私の名前は佐藤です。';

$regex = '/私の名前は(.+)です。/u';

preg_match($regex, $text, $matches);

var_dump($matches);

var_dump($matches) の結果は下記のようになります。

array(2) {
  [0]=>
  string(30) "私の名前は佐藤です。"
  [1]=>
  string(6) "佐藤"
}

array(2) {

[0]=>

string(30) "私の名前は佐藤です。"

[1]=>

string(6) "佐藤"

}

2 Responses to “[PHP] preg_match の正規表現の中で日本語（マルチバイト文字）を使う”

PHPの全角とブラケットを用いたpreg_matchの方法 – (void) より:

2013/08/29 17:09

[…] ◎参考サイト [PHP]preg_matchの正規表現の中で日本語（マルチバイト文字）を使う « Codaholic […]
有限会社ノーティーズ【PHP】正規表現で文字数をカウントして強制的に改行させるより:

2016/02/16 11:07

[…] ■[自分用メモ]正規表現を使ってn文字ごとに改行する。 [PHP]preg_matchの正規表現の中で日本語（マルチバイト文字）を使う […]