استفاده از متا کارکتر ها و کلاس ها

مدرس: علی بیگدلی
تاریخ انتشار: 1402/05/04
تعداد بازدید: 143

متا کارکتر نقطه یا .

متا نویسه نقطه (.) مخفف هر کاراکتر منفرد در متن است.

import re

words = ('seven', 'even', 'prevent', 'revenge', 'maven', 
    'eleven', 'amen', 'event')

pattern = re.compile(r'.even')

for word in words:
    if re.match(pattern, word):
        print(f'The {word} matches')

در مثال ، ما یک تاپل با هشت کلمه داریم. ما یک الگوی حاوی نقطه متاکارکتررا روی هر یک از کلمات اعمال می کنیم.

pattern = re.compile(r'.even')

نقطه مخفف هر کاراکتر واحد در متن است. شخصیت باید حضور داشته باشد.

The seven matches 
The revenge matches

دو کلمه با الگوی مطابقت دارد: seven و revenge

استفاده از علامت ?

کاراکتر متا علامت سوال (؟) یک کمیت ساز است که با عنصر قبلی صفر یا یک بار مطابقت دارد.

import re

words = ('seven', 'even','prevent', 'revenge', 'maven', 
    'eleven', 'amen', 'event')

pattern = re.compile(r'.?even')

for word in words:

    if re.match(pattern, word):
        print(f'The {word} matches')

در مثال ، ما یک علامت سوال بعد از نقطه اضافه می کنیم. این بدان معنی است که در الگو می توانیم یک کارکتر دلخواه داشته باشیم یا نمی توانیم آنجا کاراکتری داشته باشیم.

The seven matches 
The even matches 
The revenge matches 
The event matches

این بار ، علاوه بر Seven و revenge ، کلمات even و event نیز مطابقت دارند.

استفاده از علامت ^

لنگرها موقعیت های کاراکترها را در متن مشخصی مطابقت می دهند. هنگام استفاده از ^ ، مطابقت باید در ابتدای رشته و هنگام استفاده از $ ، مطابقت باید در انتهای رشته رخ دهد.

import re

sentences = ('I am looking for Jane.',
    'Jane was walking along the river.',
    'Kate and Jane are close friends.')

pattern = re.compile(r'^Jane')

for sentence in sentences:
    
    if re.search(pattern, sentence):
        print(sentence)

در مثال ، ما سه جمله داریم. الگوی جستجو ^ Jane است. این الگو بررسی می کند که رشته "Jane" در ابتدای متن قرار دارد یا خیر.

تطابق دقیق یا Exact

مطابقت دقیق را می توان با تابع fullmatch یا با قرار دادن اصطلاح بین آن انجام داد: ^ و $.

import re

words = ('book', 'bookworm', 'Bible', 
    'bookish','cookbook', 'bookstore', 'pocketbook')

pattern = re.compile(r'^book$')

for word in words:

    if re.search(pattern, word):
        print(f'The {word} matches')

در مثال ، ما به دنبال یک مطابقت دقیق برای اصطلاح "book" هستیم.

کلاس های کارکتر

یک کلاس کاراکتر مجموعه ای از کاراکترها را تعریف می کند که هر یک از آنها می تواند در یک رشته ورودی برای موفقیت یک تطابق وجود داشته باشد.

import re

words = ('a gray bird', 'grey hair', 'great look')

pattern = re.compile(r'gr[ea]y')

for word in words:

    if re.search(pattern, word):
        print(f'{word} matches')

در مثال ، ما از کلاس کاراکتر استفاده می کنیم تا کلمات gray و greyرا شامل شود.

pattern = re.compile(r'gr[ea]y')

کلاس [ea] اجازه می دهد تا از کارکتر های "e" یا "a" در الگو استفاده شود.

حساسیت به بزرگ یا کوچک بودن لغات

به طور پیش فرض ، مطابقت الگوها به حروف کوچک بزرگ حساس است. با عبور re.IGNORECASE به تابع کامپایل ، می توانیم آن را نسبت به حروف بزرگ حساس نکنیم.

import re

words = ('dog', 'Dog', 'DOG', 'Doggy')

pattern = re.compile(r'dog', re.IGNORECASE)

for word in words:
    if re.match(pattern, word):
        print(f'{word} matches')

در مثال ، ما الگوی مورد نظر را بدون در نظر گرفتن مورد به کار می بریم.

dog matches
Dog matches
DOG matches
Doggy matches

گزینه ها یا Alternations

اپراتور تناوب | یک عبارت منظم با چندین انتخاب ایجاد می کند.

import re

words = ("Jane", "Thomas", "Robert",
    "Lucy", "Beky", "John", "Peter", "Andy")

pattern = re.compile(r'Jane|Beky|Robert')

for word in words:
    
    if re.match(pattern, word):
        print(word)

ما هشت نام در این لیست داریم.

pattern = re.compile(r'Jane|Beky|Robert')

این عبارت منظم به دنبال رشته های "jane" ، "beky" یا "robert" است.

تابع یابنده یا finditer

تابع finditer یک تکرار کننده را ارائه می دهد که اشیا match مطابقت را در تمام موارد غیر همپوشانی همسان برای الگوی موجود در یک رشته باز می گرداند.

import re

text = 'I saw a fox in the wood. The fox had red fur.'

pattern = re.compile(r'fox')

found = re.finditer(pattern, text)

for item in found:

    s = item.start()
    e = item.end()
    print(f'Found {text[s:e]} at {s}:{e}')

در مثال ، ما اصطلاح "fox" را در متن جستجو می کنیم. ما از مکرر موارد منطبق برمی آییم و آنها را با شاخص های آنها چاپ می کنیم.

s = item.start()
e = item.end()

توابع شروع و پایان به ترتیب شاخص شروع و پایان را برمی گردانند.

Found fox at 8:11
Found fox at 29:32

بعدی

قبلی

آموزش پایتون پیشرفته

جلسات دوره

pyinstaller چیست؟

استفاده از pyinstaller

سفارشی سازی ساختار خروجی

virtualenv چیست؟

نصب و استفاده از virtualenv

آشنایی با ماژول Logging

تنظیمات پایه یا Basic Config در logging

ردگیری عملکرد در exception

کلاس ها و توابع log

استفاده از handlers

متد های دیگر تنظیمات در logging

شروع کار با ماژول زمان

Timestamp و Vice Versa

اندازه گیری اختلافات زمانی

فرمت سازی خروجی زمانی

مدیریت timezone

کار با ماژول os

کار با path

کار با ماژول sys

کار با subprocess

آشنایی با regex

استفاده ساده از توابع re

استفاده از متا کارکتر ها و کلاس ها

مثال های کاربردی از regex

آشنایی و اولین استفاده از argparse

دیگر استدلال های argparse

آشنایی با requests

HTTP response status codes

ویژگی های دیگر در request

آشنایی و کار با json

Serializing JSON و dump

Deserializing JSON و load

Pretty Print JSON

آشنایی با pickle

استفاده از ماژول Pickle

برنامه نویسی چند پردازشی Multi Proccessing

برنامه نویسی چند نخی Multi Threading

استفاده از ThreadPoolExecutor

استفاده از lock بر روی object ها

بازگشت به صفحه دوره

استفاده از متا کارکتر ها و کلاس ها

متا کارکتر نقطه یا .

استفاده از علامت ?

استفاده از علامت ^

تطابق دقیق یا Exact

کلاس های کارکتر

حساسیت به بزرگ یا کوچک بودن لغات

گزینه ها یا Alternations

تابع یابنده یا finditer

آموزش پایتون پیشرفته

جلسات دوره

آشنایی با PyInstaller

virtualenv در پایتون

ماژول logging

ماژول Datetime و Time

ماژول os و sys و subprocess

ماژول re (regex)

ماژول argparse

ماژول Requests و json

ماژول pickle و ConfigParser

ماژول Multi Processing & Threading