استخراج نکات مفید از متن توسط روشهای الگوریتمهای آماری، متنکاوی، آنالیتیک متن، یا یادگیری ماشین از متن، نامیده میشود. انتخاب اصطلاح تا حد زیادی به جامعه پایه متخصص بستگی دارد. در این کتاب، از این ترمها بهصورت متناوب استفاده میشود. آنالیتیک متن در سالهای اخیر، بهعلت وفور دادههای متنی در وب، شبکههای اجتماعی، ایمیلها، کتابخانههای دیجیتال، و سایتهای گفتگو، بهطور فزاینده مقبول واقع شده است.
در این کتاب، تنوعی از الگوریتمهای متنکاوی، نظیر مدلسازی فاکتور ناپیدا، خوشهبندی، طبقهبندی، بازیابی، و کاربردهای مختلف وب، پوشش داده میشود. مطالب ارایه شده در اکثر فصول خودکفا بوده و بهجز شناخت ابتدایی جبر خطی و احتمال، آشنایی قبلی با دادهکاوی و یادگیری ماشین، مفروض نیست.
کتاب متن کاوی