Увод у Питхон Регек

Питхон је данас најпознатија реч у технолошкој индустрији. То је језик који брзо добија на популарности. То је врло динамичан језик и може се користити за израду веб апликација за алгоритме машинског учења. У овом чланку ћемо сазнати како се Регек користи у Питхон-у. Регек је кратак облик Регулар Екпрессион-а и у основи је то низ знакова који се може користити као узорак. Добра ствар је што Питхон има сопствени уграђени Регек пакет познат као ре.

Синтакса:

Разумећемо синтаксу са примером. Примјер за то можемо претражити низ да видимо да ли почиње са "Хе" и завршава са "смарт".

import reword = "He is very smart"
x =re.search("^He.*smart$", word)
print(x)

Ако погледате синтаксу, врло је једноставно, прво морате да увезете регек пакет који је поново и затим користите било коју од функција увезеног пакета према вашем захтеву. Ако у Јупитеру покренемо горњи узорак кода, добићемо резултат испод.

Регек функције у Питхон-у

Постоји много функција за регек које нам помажу у претраживању низа за подударање. Пре тога прво ћемо научити о ликовима које обично видимо у функцији регек.

()

Представља скуп знакова.

.

Представља било који знак, осим нове линије.

*

Представља нула или више појава.

+

Представља једну или више појава.

^

Представља почетни карактер

$

Представља завршни знак.

|

Представља или.

()

Представља хватање и груписање.

\

Обично се користи за бекство од посебних знакова

Регек такође има неколико посебних секвенци које ће бити корисно знати на пример:

\ в

Приказује подударање ако стринг има било који скуп знакова речи из (0-9), АЗ или аз и подвлака.

\ В

Враћа подударање ако у низу нема знакова речи.

\ д

Ови резултати се подударају када у низу постоје цифре.

\ Д

Супротно је претходном јер враћа подударање ако у низу нема цифара.

\ с

Користи се за проверу знакова са белим размаком у низу. Враћа се подударно ако су присутни бели знакови.

\ С

Враћа подударање када у низу нема белих размака.

Функције које се користе за Регек операције

Погледајмо различите функције ре модула које се могу користити за операције регек-а у питхону.

1. финдалл () функција: Ова функција је присутна у модулу. Враћа листу свих подударања у низу. Понавља се с лева на десно преко низа. Утакмице се такође враћају по истом редоследу претраживања. Прећи ћемо кроз пример тога. Претпоставимо да желимо да пронађемо све цифре присутне у низу. За то ћемо користити функцију финдалл () у којој ћемо пронаћи све цифре присутне у низу. Да видимо сада код за ово:

Шифра:

import re
word = "Raju is 22 years old and his mobile number last three-digit is 789"
rgex ='\d+'
x =re.findall(rgex, word)
print(x)

Ако прођемо кроз код, у основи нам је додељена реч променљиве низом који садржи цифре, а затим прослеђујемо одговарајући регек симбол за цифре заједно са променљивом речју као аргументима у функцији финдалл ()

Сада, да видимо излаз.

Као што видите, као резултат добијамо листу бројева.

2. сеарцх () функција: Функција претраживања користи се за претраживање образаца у низу и ако се пронађе подударање враћа објект. Овде морамо запамтити једну ствар ако постоји више подударања, а онда се враћа само прва појава. Ако није пронађено ниједно подударање, не враћа се ништа. Видећемо пример за ову претпоставку ако желимо да пронађемо низ који почиње одређеном речју. Тестираћемо и случајеве позитивних и негативних подударања. Да видимо шифру за исти.

Шифра:

import re
word = "Raju is 22 years old"
rgex ='^Raju'
x =re.search(rgex, word)
print(x)
regex1= '^Mohan'
x1 = re.search(regex1, word)
print(x1)

Овде се променљива 'регек' користи у позитивном сценарију, а променљива 'регек1' за негативни сценарио. Сада погледајте излаз.

У првом случају враћамо објект подударања, док у другом случају враћамо „Ноне“.

3. Функција раздвајања (): Ова функција раздваја низ након сваког подударања, што значи да чим постоји подударање у низу, ова функција одваја низ одатле. Дакле, ако постоје три меча, бит ће три подјела. Видећемо пример. Претпоставимо да желимо поделити низ након сваког размака. Дакле, ову подељену функцију можемо добро искористити у тој ситуацији.

Шифра:

import re
word = "Raju is 22 years old"
rgex ='\s'
x =re.split(rgex, word)
print(x)

Овде обрасци представљају карактер белог простора. Сада да видимо излаз.

Као што видите у излазу, низ се дели након сваког размака.

4. суб () функција: Ова функција замјењује подударности низом или карактером по избору корисника. То у основи значи да ако постоји подударање у низу, он ће замијенити тај подударни знак или низ вашим низом или знаком и вратити модифицирани низ. Потребна су три аргумента. На пример, само ћемо заменити бели простор с '&' у нашем низу.

Шифра:

import re
word = "Raju is 22 years old"
rgex ='\s'
x =re.sub(rgex, '&', word)
print(x)

Сада погледајмо излаз за горњи код.

Као што видите, сви размаци су замењени са '&'.

Закључак

У овом чланку смо расправљали о модулу регек и његовим разним уграђеним функцијама Питхон-а. Регек је веома важан и широко се користи у различитим програмским језицима.

Препоручени чланци

Ово је водич за Питхон Регек. Овде смо расправљали о Уводу у Питхон Регек и неким важним регек функцијама, заједно са примером. Можете и да прођете кроз друге наше предложене чланке да бисте сазнали више -

  1. Док је Лооп у Питхон-у
  2. Обрнути број у Питхон-у
  3. Питхон Кеивордс
  4. Питхон сетови
  5. ПХП Кључне речи
  6. Ц ++ Кључне речи

Категорија: