جستجو برای:
  • صفحه اصلی
  • دوره ها
  • حساب کاربری
  • بلاگ
 

ورود

رمز عبور را فراموش کرده اید؟

هنوز عضو نشده اید؟ عضویت در سایت

وبینار آموزش GAN در مرحله آزمون ورودی است.

شرکت در آزمون
  • صفحه اصلی
  • دوره های آموزشی
  • مقالات آموزشی
  • help.onlinecourses@gmail.com
OnlineCourses
  • صفحه اصلی
  • حساب کاربری
  • دوره ها
    • آموزش‌های جامع
      • آموزش مقدماتی پایتون
      • آموزش تکمیلی پایتون
      • آموزش یادگیری ماشین با پایتون
      • آموزش یادگیری عمیق با پایتون
      • آموزش ترکیبی یادگیری ماشین و عمیق
      • آموزش دسته‌بندی ایمیل‌های اسپم
    • وبینارهای برگزار شده
      • وبینار نقشه راه هوش مصنوعی
      • وبینار تشخیص کرونا با هوش مصنوعی
      • وبینار شبکه های GAN
      • وبینار آشنایی با pca
      • وبینار پایتون مقدماتی
      • وبینار آشنایی با هوش مصنوعی
    • وبینارهای در حال ثبت نام
      • دومین وبینار GAN
  • وبلاگ
  • با ما باشید
    • ارتباط با ما
    • درباره ما
    • اساتید
0
ورود و ثبت نام

وبلاگ

OnlineCourses بلاگ ویدئوها آموزش متن کاوی – بخش اول

آموزش متن کاوی – بخش اول

ویدئوها
ارسال شده توسط admin
1397/09/21
137 بازدید
http://onlinecourses.ir/wp-content/uploads/2018/12/0001.mp4

مقدمه ای به اهمیت متن و متن کاوی

سازمان دهی دانش و متن کاوی، در بازیابی دقیق اطلاعات کاربرد بسیاری دارند. از این رو، متن کاوی می تواند کارکردهای بسیاری در بهبود سازمان دهی دانش داشته باشد. اگرچه متن کاوی، به ویژه در بخش یادگیری ماشینی و به دست آوردن اسناد و نمونه های آموزشی، نیازمند نظام های اصطلاح نامه، طبقه بندی، فهرست نویسی و نمایه سازی است، سازمان دهی برای تسریع کار خود، نیازمند فنون متن کاوی و نتیجه کارهای آن خواهد بود تا هم سرعت کار خویش را افزایش دهد و هم هزینه هایش را بکاهد. در این نوشتار، به کارکردهای متن کاوی در حوزه سازمان دهی دانش پرداخته خواهد شد.

ساختار اولیه متن

1️⃣ جملات یا رشته های ورودی ( در واقع جملات از یکسری کلمات تشکیل شده است)

2️⃣ کلمات یا نشانه ها ( کلمات از کارکترها تشکیل شده و منظور از نشانه ها علائم نگارشی مثل نقطه، فاصله و … هست)
3️⃣کارکترها (که کوچکترین جز یک متن رو تشکیل خواهد داد)
4️⃣ سندهای متنی یا فایل های بزرگتر (شما اگر یک سند word در نظر بگیرید از یکسری جملات تشکیل شده که ممکنه تعداد این جملات بسیار زیاد باشه که فایل های بزرگی بوجود خواهد آورد)
◀️ در این درس بر روی این ساختارهای اولیه متن و ویژگی هاش میپردازیم
✅ مثال : در ابتدا یک متن ایجاد میکنیم و داخل متغیر text1 ذخیره میکنیم.
>>> text1 = “Ethics are built right into the ideals and objectives of the United Nations.”
▪️برای اینکه طول متن را بدست آوردیم از تابع len برای اینکار استفاده خواهیم کرد.
>>> len(text1)
76
▪️و اگر بخواهیم کلمات داخل متن رو جدا کنیم،میتوانیم از تابع ()split برای اینکار استفاده کنیم، دقت کنید که مقدار داخل پرانتز، کارکتری خواهد بود که سبب جدا شدن کلمات میگردند،که در اینجا باید از اسپس (فاصله) استفاده کنیم
>>> text2 = text1.split(‘ ‘)
>>> len(text2)
13
همانطور که مشاهده میکنید بعد از اجرای دستور فوق عدد 13 به معنی تعداد کلمات این جمله در خروجی چاپ خواهد شد.که در پایین مشاهده میکنید.
>>> text2
[‘Ethics’, ‘are’, ‘built’, ‘right’, ‘into’, ‘the’, ‘ideals’, ‘and’, ‘objectives’, ‘of’, ‘the’, ‘United’, ‘Nations.’]

پیدا کردن کلمات با ویژگی های خاص

 

1️⃣ اگر بخواهیم کلماتی که بیش از سه حرف داشته باشند رو، کلمات طولانی بنامیم. با استفاده از حلقه for و تابع len میتوانیم این کلمات رو از جمله فوق استخراج کنیم.

>>> [w for w in text2 if len(w)>3]

[‘Ethics’, ‘built’, ‘right’, ‘into’, ‘ideals’, ‘objectives’, ‘United’, ‘Nations.’]

▪️ همانطور که در نتیجه مشاهده میکنید تمام کلمات بیش از سه حرف هستند

2️⃣ معمولا در زبان انگلیسی حرف اول اسامی و یا اولین کلمه موجود در جمله با حروف بزرگ نوشته می شود. حالا اگر بخواهیم این کلمات را از جمله استخراج کنیم؛ تابع ()istitle در پایتون اینکار رو برامون انجام میده.

>>> [w for w in text2 if w.istitle()]

[‘Ethics’, ‘United’, ‘Nations.’]

▪️ تمام کلماتی که با کارکتر بزرگ شروع میگردند را نمایش داد.

3️⃣ در پایتون اگر بخواهیم کلماتی که به یک کارکتر خاص ختم می شوند رو نمایش بدهیم کافیه از تابع ()endswith استفاده کنیم. داخل پرانتز کارکتری که میخواهیم بهش ختم بشه رو وارد میکنیم. مثال زیر رو ببینید.

>>> [w for w in text2 if w.endswith(‘s’)]

[‘Ethics’, ‘ideals’, ‘objectives’]

▪️ نمایش تمام کلماتی که به s ختم می شوند

اشتراک گذاری:
جدیدتر داستان تولد زبان پایتون

دیدگاهتان را بنویسید لغو پاسخ

محصولات فروش ویژه
  • پکیج کامل آموزش‌های چالش پایتون
  • وبینار نقشه راه هوش مصنوعی (AIRoadMap)
  • وبینار تشخیص کرونا با هوش مصنوعی
  • وبینار شبکه‌های GAN
  • وبینار آشنایی با PCA
دسته‌ها
  • کتابخانه‌ پایتون
  • مقالات
  • ویدئوها
ما که هستیم

ما گروهی از فارغ التحصیلان و دانشجویان دانشگاه صنعتی امیرکبیر هستیم که در راستای نیاز کشور به آموزش‌های جامع پایتون و هوش مصنوعی تصمیم گرفتیم دانش خود را با هم به اشتراک بذاریم.

  • استان البرز - کرج - برج یادمان
  • help.onlinecourses@gmail.com
دسترسی سریع
  • صفحه اصلی
  • بلاگ
  • دوره ها
  • حساب کاربری
  • سبد خرید
  • پرداخت
خبرنامه

از آخرین آموزش‌های رایگان و تخفیف‌های شگفت انگیز با خبر شوید.

تمامی حقوق برای سایت OnlineCourses محفوظ می باشد.

درخواست مشاوره رایگان

    در صورت نیاز به مشاوره می توانید فرم را تکمیل نمایید و یا با ما در ارتباط باشید.