Unicode 字符串
Python 中定義一個 Unicode 字符串和定義一個普通字符串一樣簡單:
引號前小寫的"u"表示這里創(chuàng)建的是一個 Unicode 字符串。如果你想加入一個特殊字符,可以使用 Python 的 Unicode-Escape 編碼。如下例所示:
被替換的 \u0020 標(biāo)識表示在給定位置插入編碼值為 0x0020 的 Unicode 字符(空格符)。
在Python2中,普通字符串是以8位ASCII碼進行存儲的,而Unicode字符串則存儲為16位unicode字符串,這樣能夠表示更多的字符集。使用的語法是在字符串前面加上前綴 u。
在Python3中,所有的字符串都是Unicode字符串。
Python 的字符串內(nèi)建函數(shù)
字符串方法是從python1.6到2.0慢慢加進來的—;—;它們也被加到了Jython中。
這些方法實現(xiàn)了string模塊的大部分方法,如下表所示列出了目前字符串內(nèi)建支持的方法,所有的方法都包含了對Unicode的支持,有一些甚至是專門用于Unicode的。
方法 | 描述 |
string.capitalize()
把字符串的第一個字符大寫
string.center(width)
返回一個原字符串居中,并使用空格填充至長度 width 的新字符串
string.count(str, beg=0, end=len(string))
返回 str 在 string 里面出現(xiàn)的次數(shù),如果 beg 或者 end 指定則返回指定范圍內(nèi) str 出現(xiàn)的次數(shù)
string.decode(encoding='UTF-8', errors='strict')
以 encoding 指定的編碼格式解碼 string,如果出錯默認報一個 ValueError 的 異 常 , 除非 errors 指 定 的 是 'ignore' 或 者'replace'
string.encode(encoding='UTF-8', errors='strict')
以 encoding 指定的編碼格式編碼 string,如果出錯默認報一個ValueError 的異常,除非 errors 指定的是'ignore'或者'replace'
string.endswith(obj, beg=0, end=len(string))
檢查字符串是否以 obj 結(jié)束,如果beg 或者 end 指定則檢查指定的范圍內(nèi)是否以 obj 結(jié)束,如果是,返回 True,否則返回 False.
string.expandtabs(tabsize=8)
把字符串 string 中的 tab 符號轉(zhuǎn)為空格,tab 符號默認的空格數(shù)是 8。
string.find(str, beg=0, end=len(string))
檢測 str 是否包含在 string 中,如果 beg 和 end 指定范圍,則檢查是否包含在指定范圍內(nèi),如果是返回開始的索引值,否則返回-1
string.format()
格式化字符串
string.index(str, beg=0, end=len(string))
跟find()方法一樣,只不過如果str不在 string中會報一個異常.
string.isalnum()
如果 string 至少有一個字符并且所有字符都是字母或數(shù)字則返回 True,否則返回 False
string.isalpha()
如果 string 至少有一個字符并且所有字符都是字母則返回 True,否則返回 False
string.isdecimal()
如果 string 只包含十進制數(shù)字則返回 True 否則返回 False.
string.isdigit()
如果 string 只包含數(shù)字則返回 True 否則返回 False.
string.islower()
如果 string 中包含至少一個區(qū)分大小寫的字符,并且所有這些(區(qū)分大小寫的)字符都是小寫,則返回 True,否則返回 False
string.isnumeric()
如果 string 中只包含數(shù)字字符,則返回 True,否則返回 False
string.isspace()
如果 string 中只包含空格,則返回 True,否則返回 False.
string.istitle()
如果 string 是標(biāo)題化的(見 title())則返回 True,否則返回 False
string.isupper()
如果 string 中包含至少一個區(qū)分大小寫的字符,并且所有這些(區(qū)分大小寫的)字符都是大寫,則返回 True,否則返回 False
string.join(seq)
以 string 作為分隔符,將 seq 中所有的元素(的字符串表示)合并為一個新的字符串
string.ljust(width)
返回一個原字符串左對齊,并使用空格填充至長度 width 的新字符串
string.lower()
轉(zhuǎn)換 string 中所有大寫字符為小寫.
string.lstrip()
截掉 string 左邊的空格
string.maketrans(intab, outtab])
maketrans() 方法用于創(chuàng)建字符映射的轉(zhuǎn)換表,對于接受兩個參數(shù)的最簡單的調(diào)用方式,第一個參數(shù)是字符串,表示需要轉(zhuǎn)換的字符,第二個參數(shù)也是字符串表示轉(zhuǎn)換的目標(biāo)。
max(str)
返回字符串 str 中最大的字母。
min(str)
返回字符串 str 中最小的字母.
string.partition(str)
有點像 find()和 split()的結(jié)合體,從 str 出現(xiàn)的第一個位置起,把 字 符 串 string 分 成 一 個 3 元 素 的 元 組 (string_pre_str,str,string_post_str),如果 string 中不包含str 則 string_pre_str == string.
string.replace(str1, str2, num=string.count(str1))
把 string 中的 str1 替換成 str2,如果 num 指定,則替換不超過 num 次.
string.rfind(str, beg=0,end=len(string) )
類似于 find()函數(shù),不過是從右邊開始查找.
string.rindex( str, beg=0,end=len(string))
類似于 index(),不過是從右邊開始.
string.rjust(width)
返回一個原字符串右對齊,并使用空格填充至長度 width 的新字符串
string.rpartition(str)
類似于 partition()函數(shù),不過是從右邊開始查找
string.rstrip()
刪除 string 字符串末尾的空格.
string.split(str="", num=string.count(str))
以 str 為分隔符切片 string,如果 num 有指定值,則僅分隔 num+ 個子字符串
string.splitlines([keepends])
按照行('\r', '\r\n', \n')分隔,返回一個包含各行作為元素的列表,如果參數(shù) keepends 為 False,不包含換行符,如果為 True,則保留換行符。
string.startswith(obj, beg=0,end=len(string))
檢查字符串是否是以 obj 開頭,是則返回 True,否則返回 False。如果beg 和 end 指定值,則在指定范圍內(nèi)檢查.
string.strip([obj])
在 string 上執(zhí)行 lstrip()和 rstrip()
string.swapcase()
翻轉(zhuǎn) string 中的大小寫
string.title()
返回"標(biāo)題化"的 string,就是說所有單詞都是以大寫開始,其余字母均為小寫(見 istitle())
string.translate(str, del="")
根據(jù) str 給出的表(包含 256 個字符)轉(zhuǎn)換 string 的字符,要過濾掉的字符放到 del 參數(shù)中
string.upper()
轉(zhuǎn)換 string 中的小寫字母為大寫
string.zfill(width)
返回長度為 width 的字符串,原字符串 string 右對齊,前面填充0
Python 的字符串常用內(nèi)建函數(shù)如下:
方法 | 描述 |
capitalize()
將字符串的第一個字符轉(zhuǎn)換為大寫
center(width, fillchar)
返回一個指定的寬度 width 居中的字符串,fillchar 為填充的字符,默認為空格。
count(str, beg= 0,end=len(string))
返回 str 在 string 里面出現(xiàn)的次數(shù),如果 beg 或者 end 指定則返回指定范圍內(nèi) str 出現(xiàn)的次數(shù)
bytes.decode(encoding="utf-8", errors="strict")
Python3 中沒有 decode 方法,但我們可以使用 bytes 對象的 decode() 方法來解碼給定的 bytes 對象,這個 bytes 對象可以由 str.encode() 來編碼返回。
encode(encoding='UTF-8',errors='strict')
以 encoding 指定的編碼格式編碼字符串,如果出錯默認報一個ValueError 的異常,除非 errors 指定的是'ignore'或者'replace'
endswith(suffix, beg=0, end=len(string))
檢查字符串是否以 obj 結(jié)束,如果beg 或者 end 指定則檢查指定的范圍內(nèi)是否以 obj 結(jié)束,如果是,返回 True,否則返回 False.
expandtabs(tabsize=8)
把字符串 string 中的 tab 符號轉(zhuǎn)為空格,tab 符號默認的空格數(shù)是 8 。
find(str, beg=0, end=len(string))
檢測 str 是否包含在字符串中,如果指定范圍 beg 和 end ,則檢查是否包含在指定范圍內(nèi),如果包含返回開始的索引值,否則返回-1
index(str, beg=0, end=len(string))
跟find()方法一樣,只不過如果str不在字符串中會報一個異常.
isalnum()
如果字符串至少有一個字符并且所有字符都是字母或數(shù)字則返回 True,否則返回 False
isalpha()
如果字符串至少有一個字符并且所有字符都是字母則返回 True,否則返回 False
isdigit()
如果字符串只包含數(shù)字則返回 True 否則返回 False..
islower()
如果字符串中包含至少一個區(qū)分大小寫的字符,并且所有這些(區(qū)分大小寫的)字符都是小寫,則返回 True,否則返回 False
isnumeric()
如果字符串中只包含數(shù)字字符,則返回 True,否則返回 False
isspace()
如果字符串中只包含空白,則返回 True,否則返回 False.
istitle()
如果字符串是標(biāo)題化的(見 title())則返回 True,否則返回 False
isupper()
如果字符串中包含至少一個區(qū)分大小寫的字符,并且所有這些(區(qū)分大小寫的)字符都是大寫,則返回 True,否則返回 False
join(seq)
以指定字符串作為分隔符,將 seq 中所有的元素(的字符串表示)合并為一個新的字符串
len(string)
返回字符串長度
ljust(width[, fillchar])
返回一個原字符串左對齊,并使用 fillchar 填充至長度 width 的新字符串,fillchar 默認為空格。
lower()
轉(zhuǎn)換字符串中所有大寫字符為小寫.
lstrip()
截掉字符串左邊的空格或指定字符。
maketrans()
創(chuàng)建字符映射的轉(zhuǎn)換表,對于接受兩個參數(shù)的最簡單的調(diào)用方式,第一個參數(shù)是字符串,表示需要轉(zhuǎn)換的字符,第二個參數(shù)也是字符串表示轉(zhuǎn)換的目標(biāo)。
max(str)
返回字符串 str 中最大的字母。
min(str)
返回字符串 str 中最小的字母。
replace(old, new [, max])
把 將字符串中的 str1 替換成 str2,如果 max 指定,則替換不超過 max 次。
rfind(str, beg=0,end=len(string))
類似于 find()函數(shù),不過是從右邊開始查找.
rindex(str, beg=0, end=len(string))
類似于 index(),不過是從右邊開始.
rjust(width,[, fillchar])
返回一個原字符串右對齊,并使用fillchar(默認空格)填充至長度 width 的新字符串
rstrip()
刪除字符串字符串末尾的空格.
split(str="", num=string.count(str))
num=string.count(str))以 str 為分隔符截取字符串,如果 num 有指定值,則僅截取 num+1 個子字符串
splitlines([keepends])
按照行('\r', '\r\n', \n')分隔,返回一個包含各行作為元素的列表,如果參數(shù) keepends 為 False,不包含換行符,如果為 True,則保留換行符。
startswith(substr, beg=0,end=len(string))
檢查字符串是否是以指定子字符串 substr 開頭,是則返回 True,否則返回 False。如果beg 和 end 指定值,則在指定范圍內(nèi)檢查。
strip([chars])
在字符串上執(zhí)行 lstrip()和 rstrip()
swapcase()
將字符串中大寫轉(zhuǎn)換為小寫,小寫轉(zhuǎn)換為大寫
title()
返回"標(biāo)題化"的字符串,就是說所有單詞都是以大寫開始,其余字母均為小寫(見 istitle())
translate(table, deletechars="")
根據(jù) str 給出的表(包含 256 個字符)轉(zhuǎn)換 string 的字符,要過濾掉的字符放到 deletechars 參數(shù)中
upper()
轉(zhuǎn)換字符串中的小寫字母為大寫
zfill (width)
返回長度為 width 的字符串,原字符串右對齊,前面填充0
isdecimal()
檢查字符串是否只包含十進制字符,如果是返回 true,否則返回 false。