導航:首頁 > 凈水問答 > python過濾特殊符號

python過濾特殊符號

發布時間:2021-11-02 12:13:18

Ⅰ Python:如何過濾特殊字元和亂碼的字元

如果是從Html文本弄來的,那直接download Html的源代碼,然後直接替換其中的<div class="">這里是隨機字元串</div>

Python裡面使用xml.minidom就OK

Ⅱ python 去掉標點符號

這個來明顯是錯誤的,你根本自沒理解replace函數是怎麼用的。

Python str.replace(old, new[, max])
方法把字元串str中的 old(舊字元串) 替換成 new(新字元串),如果指定第三個參數max,則替換不超過 max
次。


如果非要用replace()函數來實現要這樣寫:

importstring
m=l
forcinstring.punctuation:
m=m.replace(c,")


更簡便的方法是用translate(),代碼如下:

importstring
m=l.translate(None,string.punctuation)

Ⅲ python pandas 過濾某列特殊字元求助

改成r="\W"試試

Ⅳ python 截取特殊符號後面的字元串

s="01-1"
s1=s.split("-")
s2=int(s1[1])

如果都是只有一個 - 的話可以這樣就好...

Ⅳ python有沒有好的去處字元串中特殊字元的方法

直接用str.replace就可以了。old表示將要替換的子串,new表示目標字元串,count表示替換個數。
>>> help(str.replace)
Help on method_descriptor:

replace(...)
S.replace(old, new[, count]) -> str

Return a of S with all occurrences of substring
old replaced by new. If the optional argument count is
given, only the first count occurrences are replaced.

Ⅵ python 如何去除字元串中的符號

去掉兩端字元串:
strip(),
rstrip(),lstrip()
123456789101112131415
#!/usr/bin/python3
s
=
'
-----abc123++++
'
#
刪除兩邊空字元print(s.strip())
#
刪除左邊空字元print(s.rstrip())
#
刪除右邊空字元print(s.lstrip())
#
刪除兩邊
-
+
和空字元print(s.strip().strip('-+'))
刪除單個固定位置字元:
切片
+
拼接
123456
#!/usr/bin/python3
s
=
'abc:123'#
字元串拼接方式去除冒號new_s
=
s[:3]
+
s[4:]print(new_s)
刪除任意位置字元同時刪除多種不同字元:replace(),
re.sub()
1234567891011
#!/usr/bin/python3
#
去除字元串中相同的字元s
=
'\tabc\t123\tisk'print(s.replace('\t',
''))
import
re#
去除\r\n\t字元s
=
'\r\nabc\t123\nxyz'print(re.sub('[\r\n\t]',
'',
s))
同時刪除多種不同字元:translate()
py3中為str.maketrans()做映射
1234567
#!/usr/bin/python3
s
=
'abc123xyz'#
a
_>
x,
b_>
y,
c_>
z,字元映射加密print(str.maketrans('abcxyz',
'xyzabc'))#
translate把其轉換成字元串print(s.translate(str.maketrans('abcxyz',
'xyzabc')))
去掉unicode字元中音調

#!/usr/bin/python3
import
sysimport
unicodedatas
=
"Zhào
Qián
Sūn

Zhōu

Zhèng
Wáng"remap
=
{
#
ord返回ascii值
ord('\t'):
'',
ord('\f'):
'',
ord('\r'):
None
}#
去除\t,
\f,
\ra
=
s.translate(remap)'''通過使用dict.fromkeys()
方法構造一個字典,每個Unicode
和音符作為鍵,對於的值全部為None然後使用unicodedata.normalize()
將原始輸入標准化為分解形式字元sys.maxunicode
:
給出最大Unicode代碼點的值的整數,即1114111(十六進制的0x10FFFF)。unicodedata.combining:將分配給字元chr的規范組合類作為整數返回。
如果未定義組合類,則返回0。'''cmb_chrs
=
dict.fromkeys(c
for
c
in
range(sys.maxunicode)
if
unicodedata.combining(chr(c)))
#此部分建議拆分開來理解b
=
unicodedata.normalize('NFD',
a)'''調用translate
函數刪除所有重音符'''print(b.translate(cmb_chrs))

Ⅶ python如何去除字元串中不想要的字元

問題:
過濾用戶輸入中前後多餘的空白字元
『 ++++abc123--- 『
過濾某windows下編輯文本中的』\r』:
『hello world \r\n』
去掉文本中unicode組合字元,音調
"Zhào Qián Sūn Lǐ Zhōu Wú Zhèng Wáng"
如何解決以上問題?
去掉兩端字元串: strip(), rstrip(),lstrip()

123456789101112131415

#!/usr/bin/python3 s = ' -----abc123++++ ' # 刪除兩邊空字元print(s.strip()) # 刪除左邊空字元print(s.rstrip()) # 刪除右邊空字元print(s.lstrip()) # 刪除兩邊 - + 和空字元print(s.strip().strip('-+'))

刪除單個固定位置字元: 切片 + 拼接

123456

#!/usr/bin/python3 s = 'abc:123'# 字元串拼接方式去除冒號new_s = s[:3] + s[4:]print(new_s)

刪除任意位置字元同時刪除多種不同字元:replace(), re.sub()

1234567891011

#!/usr/bin/python3 # 去除字元串中相同的字元s = '\tabc\t123\tisk'print(s.replace('\t', '')) import re# 去除\r\n\t字元s = '\r\nabc\t123\nxyz'print(re.sub('[\r\n\t]', '', s))

同時刪除多種不同字元:translate() py3中為str.maketrans()做映射

1234567

#!/usr/bin/python3 s = 'abc123xyz'# a _> x, b_> y, c_> z,字元映射加密print(str.maketrans('abcxyz', 'xyzabc'))# translate把其轉換成字元串print(s.translate(str.maketrans('abcxyz', 'xyzabc')))

去掉unicode字元中音調


#!/usr/bin/python3 import sysimport unicodedatas = "Zhào Qián Sūn Lǐ Zhōu Wú Zhèng Wáng"remap = { # ord返回ascii值 ord('\t'): '', ord('\f'): '', ord('\r'): None }# 去除\t, \f, \ra = s.translate(remap)'''通過使用dict.fromkeys() 方法構造一個字典,每個Unicode 和音符作為鍵,對於的值全部為None然後使用unicodedata.normalize() 將原始輸入標准化為分解形式字元sys.maxunicode : 給出最大Unicode代碼點的值的整數,即1114111(十六進制的0x10FFFF)。unicodedata.combining:將分配給字元chr的規范組合類作為整數返回。 如果未定義組合類,則返回0。'''cmb_chrs = dict.fromkeys(c for c in range(sys.maxunicode) if unicodedata.combining(chr(c))) #此部分建議拆分開來理解b = unicodedata.normalize('NFD', a)'''調用translate 函數刪除所有重音符'''print(b.translate(cmb_chrs))

Ⅷ python 如何去特殊字元

針對這里的問題,我們可以先將文件名解碼成unicode,然後用gbk編碼,如果拋出異常,說明編碼失敗,即文件名中存在特殊字元。下面是一個小例子:

#! /usr/bin/env python
# -*- coding: utf-8 -*-

file_names = ["œ®特殊字元.txt",
"沒有特殊字元.txt",
"ßååå.txt"
]
for file_name in file_names:
try:
file_name.decode("utf-8").encode("gbk")
print file_name, "..."
except UnicodeEncodeError:
print file_name, "中獎"

"""outputs:
œ®特殊字元.txt 中獎
沒有特殊字元.txt ...
ßååå.txt 中獎
"""

Ⅸ python使用正則表達式刪除中文字元中的特殊字元,出現異常: 1、特殊字元無法完全刪除。

轉義的\全部去掉,換成r"內容"看看。比如
r"(){},.?/\+-"

Ⅹ python 怎麼過濾 emoji 表情符號


string =「你猜猜em[4500]48570em[2250]」
cc = re.findall('[\u4e00-\u9fa5]', string)
cc="你猜猜"
去提取中文或者英文不也可以達到去除表情符號的作用嗎版?我用的反權向思維

閱讀全文

與python過濾特殊符號相關的資料

熱點內容
黑龍江洗煤廢水被曝稅對 瀏覽:776
離子交換分離技術概念 瀏覽:338
凈水器廢水利用妙招 瀏覽:341
飲水機什麼時候淘汰 瀏覽:532
醫用酒精蒸餾 瀏覽:369
碧然德濾芯三代含樹脂 瀏覽:279
凈水機11是什麼意思 瀏覽:329
大金中央空調室內機冷凝水提升泵 瀏覽:743
UF中空纖維超濾膜怎樣接管 瀏覽:666
如何洗掉鍋里水垢 瀏覽:623
超濾定義是什麼 瀏覽:186
那些除垢劑清洗自來水管道 瀏覽:552
中江縣海凈爾凈水器維修部在哪裡 瀏覽:767
佛山工業濾芯哪裡買 瀏覽:528
空氣凈化器為什麼會有滴滴聲 瀏覽:217
陟怎麼讀音飲水機什麼牌子最好 瀏覽:324
回字用成語是什麼成語 瀏覽:208
壽光凈水設備哪個牌子好 瀏覽:178
樹脂都是聚合物嗎 瀏覽:116
車門水垢 瀏覽:652