読者です 読者をやめる 読者になる 読者になる

すべての漢字を取り出す正規表現

python

totonの日記さんに詳しいようです。
すべての漢字を取り出す正規表現 - totonの日記
「すべての漢字を取り出す正規表現」の続き - totonの日記
とはいえぐぐっただけです。
既に2005年に通過されていた模様。

mpt = [re.compile(u'[一-龠]')]

def main():
    target = u'漢字正規表現亜腕一十百千万億兆京'
    for mp in mpt:
        print "pattern = %s, target = %s" % ( mp.pattern.encode('utf-8'), target.encode('utf-8'))
        ml = mp.findall(target)
        for m in ml:
            print '%s' % (m).encode('utf-8'),
        print 
    pass

pattern = [一-龠], target = 漢字正規表現亜腕一十百千万億兆京
漢 字 正 規 表 現 亜 腕 一 十 百 千 万 億 兆 京

お。

追記:
404 Not Foundさん
も参考のこと。