Get Mystery Box with random crypto!

گلچین علم داده

لوگوی کانال تلگرام datascience_golchin — گلچین علم داده گ
لوگوی کانال تلگرام datascience_golchin — گلچین علم داده
آدرس کانال: @datascience_golchin
دسته بندی ها: دستهبندی نشده
زبان: فارسی
مشترکین: 718
توضیحات از کانال

جایی برای راهنمایی در مورد دیتا ساینتیست شدن
Admin: @peyman886

Ratings & Reviews

2.00

2 reviews

Reviews can be left only by registered users. All reviews are moderated by admins.

5 stars

0

4 stars

0

3 stars

1

2 stars

0

1 stars

1


آخرین پیام ها

2022-07-02 16:30:01 #Machine_Learning
#Programming

الی ماشالا کلی کورس مختلف برای این درس هست یعنی تقریبن هرکی از ننه‌اش قهر میکنه میره یه ماشین لرنینگ درس میده با این حال مفاهیم پایه ای رو خوب و قشنگ توضیح نمیدن صرفا میگن فلان الگوریتم جدید اومده اینم کدش در صورتیکه اصلن لازم نیست شما مدل های زیادی بلد باشین یا جدیدا مد شده میگن state of the art الان فلان مدله در صورتیکه مهم اینه بیس داستان رو بدونین چیه و شهود درستی داشته باشین که اون مدل چرا خوب کار میکنه و اصلن تو چجور مسائلی باید ازش استفاده کرد هزار تا پارامتر دیگه علاوه بر دقت مدل مثه زمان اجرا مهمه نه اینکه هرچی اومد دستتون بگین شبکه عصبی میزنیم میره!

القصه با این حال به نظرم بهترین کورسی که واسه ماشین لرنینگ وجود داره کورس دکتر رهبان هست که تو دانشکده کامپیوتر شریف ارائه دادن

نیمه اول درس منطبق بر کورس دکتر یاسر ابو مصطفی است که تو دانشگاه caltech ارائه داده و نیمه دومشم جدیدترین روش های غیر شبکه عصبی مثه Ensemble learning ,XGboost, Adaboost, Reinforcement learning,Semi supervised learning رو درس میدن اسلایداشم تو کانال فایلاس

اما برای تمرین کردن بازم برخلاف تصور الویت با تمرینای تئوریه وگرنه کد زدن تو این زمینه فقط استفاده درست از پکیج هاست تمرینای خود دکتر رهبان خوبن هم تئوری دارن هم عملی منتها خیلی سنگینن بنابراین اگه شروع کردین به حل کردنشون ناامید نشین یه چیز زیاده تمرین.

در ادامه برنامه نویسی تو این زمینه هم باید کار با چندتا پکیج رو یاد بگیرین که البته یادگیریشون فقط به مرور زمان و با سرچ به دست میاد البته برای شروع هر کدوم یه آموزش اولیه لازمه. پکیج هایی که لازمه یاد بگیرین اینا ( numpy و pandas و mathplotlib و seaborn و scikit-learn ) هستن و پیشنهاد من کارگاه ماشین لرنینگ دکتر رضویه + ۸ جلسه اول کورس دکتر حسینی هست که توش visualization هم درس میده من خودم این کورس رو تو دانشگاه گزروندم البته خیلی خوب درس نمیده ولی تمرینا و پروژه‌ش خیلی خوب بودن مخصوصا همین قسمت های برنامه نویسیش. کد پروژه هم تو گیتهاب خودم هست. ضمنن بدونین که ۸۰ درصد کارتون دست و پنجه نرم کردن با دیتاس ۲۰ درصدش فیت کردن مدله و این هم با تجربه به دست میاد پس اینا رو دست کم نگیرین
البته خود کورس ماشین لرنینگ دکتر رضوی رو من یه نگاهی انداختم خیلی خوب بود مخصوصا اینکه خیلی ساده توضیح میدن و پیشنیاز خاصی هم نمیخواد از طرفی خیلی عملی هم کار میکنن و خب این برای قوی شدن تو برنامه نویسی پایتون کمکتون میکنه. کلن کانال خوبی دارن اگه یکی بخواد پایتونش خوب بشه مخصوصا تو حوزه ماشین لرنینگ خیلی خیلی میتونه کمک کنه

@DataScience_Golchin
100 viewsPeyman Naseri, edited  13:30
باز کردن / نظر دهید
2022-06-21 07:18:51 #Probabilty_Statistics

خب از الان بگم اول احتمال بعد آمار!!!!
متاسفانه تو دبیرستان و بدتر از اون تو نظام جدید مدارس دارن اول آمار درس میدن! آمار بدون احتمال مثه فیزیک بدون ریاضی میمونه! ضمنن شما اگه دکترای هوش مصنوعی دارین و بهترین الگوریتم های لرنینگ رو بلدین ولی احتمال بلد نیستین به نظرم به خودتون نگین دیتا ساینتیست!

۱) خب از این حرفا که بگذریم به نظرم آمار و احتمال مهندسی دکتر شریفی مناسب‌ترین کورسی هست که دیدم. علی رغم اینکه تخصص اصلی ایشون نه آماره نه الگوریتم ولی درسایی که ارائه میدن از نظر محتوا خیلی غنیه هم تقریبن همه چیز رو کامل توضیح میدن (خداییش خوبم درس میده) هم جزوه تمام جلساتش خیلی تر و تمییز توی فایلای نوتبوک هست هم تمریناش با جوابه کلن خیلی غنیه هیچ احتیاجی به هیچ کار دیگه‌ای ندارین صرفا کافیه ویدیو رو ببینین و شروع کنین به حل تمرینایی که جوابشونم هست برای اینکه چک کنین درسته یا نه. من همیشه مخالف سورس خوندن بودم چون خیلی جاها اضافه زیاد حرف میزنن مثلن از ۱۰۰۰ تا تمرینی که تو کل کتاب هست ۵۰ تاش مفیدن خوش‌بختانه تو کورس ایشون تمام این ۵۰ تای مفید هستش! خلاصه هر محتوایی که لازم داشته باشین توش هست.

فقط دوتا ایراد داره؛
۱_ با زبان R کار میکنن (البته R بد نیست و اگه میتونین حتمن یاد بگیرین برای تحلیل های آماری خیلی خوبه) منتها به نظر شخصی من این زبون آینده خیلی خوبی نداره چون نه پرفورمنسش خوبه که بگیم حالا مثلن مزیتی داره نسبت به پایتون (برخلاف زبون جدیدی مثه جولیا) نه داک درست و درمونی داره
۲_ استاد آماردان نیست و وقتشم کمه! واسه همین خیلی نمیتونه روی مفاهیم عمیق بشه و با جزئیات توضیح بده در صورتیکه شمای دیتا ساینتیست باید از آمار تحلیل رو خوب یاد بگیرین نه حالا یه انتگرال دوگانه برای گرفتن امید ریاضی!

راه حل مشکل اول؛ من پیشنهاد میکنم تمرینای عملیشو با پایتون بزنین :) خیلی ساده!
راه حل مشکل دوم؛ این دوتا درس رو باید جدا جدا یاد گرفت متاسفانه توی دانشکده‌های مهندسی کلن یه ۳ واحدی آمار و احتمال میگذرونن منتها تو دانشکده های علوم پایه ( ریاضی_ آمار_علوم کامپیوتر ) یه ۴ واحدی احتمال یه ۴ واحدی آمار واسه همین من پیشنهاد میکنم ویدیوهای احتمال دکتر علیشاهی و آمار دکتر میرصادقی رو هم ببینین! البته ویدیو های دکتر علیشاهی خیلی قدیمی ان ولی خیلی خیلی شهود خوبی میدن که تو هیچ جا ندیدم منتها اگه فک کردین شلخته درس میدن میتونین احتمال دکتر میرصادقی رو هم ببینین اگرم دوست داشتین آمار دکتر علیشاهی هم موجوده:))

کلن من خودم تو آمار خیلی دنبال یه کتاب یا کورس بودم که هم شهود خوبی بده هم بیس ریاضیشو درست بگه که متأسفانه نیافتم لذا تونستین معرفی کنین هم خودم کنجکاوم شهودمو بهتر کنم هم به درد بقیه میخوره

ضمنن نگین ''آمار و احتمال'' بگین ''احتمال و آمار'' :)

@DataScience_Golchin
220 viewsPeyman Naseri, edited  04:18
باز کردن / نظر دهید
2022-06-19 17:29:04 #LinearAlgebra

خب درس شیرین جبرخطی :) یادمه یه بار استاد میگفت شما SVD رو درک کنی میبینی PCA یه شوخیه تلخه! شاید بچه های مهندسی بدشون بیاد ولی راستش اگه بیسیک خوبی از ریاضیات داشته باشین میبینین که ماشین لرنینگ هیچی نداره صرفا یه سری محاسبات ریاضیه.
جبرخطی معمولن به دو شیوه آموزش داده میشه تو دانشکده ریاضی کاملن اثباتی و تو دانشکده های مهندسی کاملن عددی که به نظرم جفتش برای یه دیتا ساینتیست اشتباهه! شما باید شهود خوبی نسبت به این قضایا داشته باشین نه اینکه قدرت اثبات کردنتون قوی باشه یا برعکس صرفا برین از پکیج ها استفاده کنین و آخرشم اگه یه ذره خواستین مدلتون رو اصطلاحا fine tune کنین نتونین اینکارو کنین.

با این اوصاف تقریبن کورس به درد بخوری که بتونه اینا رو خوب توضیح بده و فوکوسشم روی ماشین لرنینگ باشه من پیدا نکردم اما تو این کورس جبر خطی دکتر تفاق خوشبختانه استاد علی رغم اینکه قضایا رو خیلی ساده اثبات میکنه شهود خیلی خوبی میده که هم دید جبری داشته باشین هم هندسی واسه همین اول اینو توصیه میکنم شده چند بار ببینینش کتابی هم که از روش درس میده رو من خیلی دوست دارم چون خیلی خلاصه و مفید و بدون حرفای اضافه اس (کتاب جبر خطی شلدون اکسلر) وهله اول من این کورس رو پیشنهاد میدم.

بعدش یه کورس جبرخی کاربردی داره که اونم ۱۰ جلسه اولش کل جبرخطی رو خیلی قشنگ مرور میکنه و شدیدا اون رو هم توصیه میکنم. البته من بقیه اش رو ندیدم ولی به نظر جالب میاد.

کلن به نظرم هرچی جبرخطی بخونین بازم کمه واسه همین اگه رسیدین، سر فرصت جبرخطی دکتر شهشهانی رو هم ببینین خیلی سنگینه ولی ارزششو داره

@DataScience_Golchin
212 viewsPeyman Naseri, edited  14:29
باز کردن / نظر دهید
2022-06-16 23:46:02 #Algorithm

تو زمینه دیتا کمتر اشاره میکنن که شما باید مهارت الگوریتمی داشته باشین در صورتیکه به نظرم اگه یه دیتا ساینتیست الگوریتم خوب بلد نباشه فارغ از اینکه تمییز کد زدن رو نمیفهمه خود الگوریتم های ماشین لرنینگ رو هم درست درک نمیکنه و به قول یکی از دوستان یه جورایی فقط تکنسین باقی میمونه و هیچوقت متخصص نمیشه. یادمه درس یادگیری عمیق رو که تو دانشکده برق میگزروندم این ضعف قشنگ تو بچه های مهندسی برق حس میشد چون درسای الگوریتمی قبلن پاس نکرده بودن واسه همین پیشنهاد میکنم اگه واقعن میخواین تو این حوزه به صورت جدی وارد شید حتمن سعی کنین درسای الگوریتمی هم بگذرونین.

پیشنهاد من درسای ساختار داده و طراحی الگوریتم شریفی هست که تو دانشکده کامپيوتر شریف ارائه شدن.

تو درس ساختار داده‌اش از زبان پایتون و ژوپیتر نوتبوک استفاده میکنه که این خیلی عالیه چون هم کار با نوتبوک رو یاد میگیرین هم تو پایتون قوی میشین به نظرم بعد از یادگیری مباحث پایه برنامه نویسی و تمرین کردن تو کوئرا سعی کنین حتمن این درس رو دنبال کنین و تمرین عملی هم بزنین. یه کوچولو سخته مخصوصا زدن کد الگوریتما. ولی به نظرم حتی بیشتر از درسایی مثه برنامه نویسی پیشرفته و مهندسی نرم افزار مهارت کد زدنتون رو قوی میکنه

درس طراحی الگوریتمشم از این نظر که ++C میگه خیلی خوبه به نظرم با اینکه اکثر کدا رو پایتون هست ولی درک درستی از اینکه کدا چطور روی کامپیوتر اجرا میشه نمیده واسه همین یاد گرفتنش خالی از لطف نیست اما مباحث تئوریش خیلی خیلی مهمن حتی بیشتر از مباحث ساختار داده.

ضمنن این دو تا درس یه جورایی گسسته‌طورن و اگه قبلش تمرینای گسسته انجام داده باشین راحت ترین. چون تو درس باید ایده بزنین و این ایده زدن هم با تمرین حل کردن به دست میاد پس تمرین رو جدی تر بگیرین!

@DataScience_Golchin
249 viewsPeyman Naseri, edited  20:46
باز کردن / نظر دهید
2022-06-16 23:46:02 #Calculus

این ریاضیات که شامل مباحث ریاضی عمومی ۱و ۲ و ریاضیات گسسته میشه رو اگه درساشونو تو دوره کارشناسی گزروندین همون دید کلی به نظرم کافیه نهایتن هرجا یادتون رفت برین سراغش مرور کنین اگرم بخوام کورسی براشون بگم باید برم سراغ ریاضی ۱ و ۲ شهشهانی که خیلی سنگینن اونقد عمیق نیازی به یادگیریشون نیست ولی خب اگه خواستین؛

برای ریاضی ۱ دو تا کورس از دکتر میرصادقی هست یکیشون قدیمیه و یکیشونم جدیده مطمئن نیستم کدومشون منبعش کتاب شهشهانیه هر کدوم منبعش شهشهانی بود اونو دنبال کنین برای مبحث انتگرال هم یه جزوه ای به نام "انتگرال‌خور" خیلی به درد من خورد سرچ کنین براتون میاد.

برای ریاضی ۲ هم خود دکتر شهشهانی یه کورس قدیمی دارن که به شدت توصیه میکنم دید خیلی خوبی هم برای جبرخطی که باید به صورت عمیق تر بعدن بخونین میده

برای ریاضیات گسسته که به نظرم پیشنیاز الگوریتم هم محسوب میشه همون دبیرستان کفایت میکنه اما خب چون معمولن ما از این درس فرار بودیم پیشنهاد میکنم یه کورسی براش ببینین و حتمن کلی تمرین حل کنین فاز این درس با ریاضی عمومی متفاوته خیلی آموزش مبحث نداره بیشتر باید تمرین حل کنین تقریبن کورس خوبی براش ندیدم فقط دکتر میرصادقی یه کورس براش دارن که به نظرم کافی نیست چون خیلی توش تمرین حل نمیشه یه استادی هم به اسم یوسفی هست که گویا ویدیوهایی برای کنکور ارشد مهندسی کامپیوتر میده بیرون اونم خوبه توش تمرین حل میکنه

@DataScience_Golchin
198 viewsPeyman Naseri, edited  20:46
باز کردن / نظر دهید
2022-06-16 23:46:02 #Programming

درسته برای برنامه نویسی تو حوزه هوش مصنوعی و علم داده معمولن زبان پایتون رو معرفی میکنن اما مساله‌ای که به نظرم مهمه اینه که شما اگه هر زبان دیگه‌ای قبلن برنامه‌نویسی کرده باشید پایتون رو دو سه روزه مسلط میشین منتها چیزی که مهمتر از خود زبان برنامه نویسی هست اون به اصطلاح تفکر الگوریتیمه که باید بلد باشین که به نظرم با تمرین زیاد به دست میاد نه ویدیو دیدن و کلاس رفتن.

برای این اول من کورس پایتون جادی رو پیشنهاد میکنم ولی کافی نیست پیشنهاد میکنم بعدش تو سایت کوئرا عضو شین و تمرینات دانشگاهی از آسون به سخت مرتب کنین و حل کنین تا دستتون گرم شه.

ضمنن قرار نیست اول تسلط کامل به برنامه نویسی داشته باشیم بعد بریم سراغ ریاضی عمومی. یه سری کتابخونه هستن که شما برای کار باهاشون به نظرم بهتره وقتی قرار شد ازشون استفاده کنین برین سراغ یادگیریشون مثلن نامپای رو بزارین وقتی شروع کردین به یادگیری ماشین لرنینگ برین سراغش

@DataScience_Golchin
176 viewsPeyman Naseri, edited  20:46
باز کردن / نظر دهید
2022-06-16 23:46:02 #roadmap

1) Programming
2) Calculus
3) Algorithm
4) Linear Algebra
5) Probability & Statistics
6) Machine Learning
7) Deep Learning

ترتیب کلی که من پیشنهاد میکنم اینه و اغلب هم سعی میکنم کورس دانشگاهی به زبان فارسی معرفی کنم.

آپدیت: من در مورد این ''ترتیب کلی''یه توضیح کلی بدم. من صرفا گفتم اینطوری بهتره. این پیشنیازی بعضی جاها خیلی خودشو نشون میده بعضی جاها نه خیلی. مثلن لزومی نداره آمار رو حتمن بعد از جبرخطی بخونین ولی اگه بدون دانش برنامه نویسی برین سراغ الگوریتم قطعن چیزی نخواهید فهمید.

آپدیت۲ : من برای هر تیکه چندتا کورس پیشنهاد کردم اما قرار نیست شما به ترتیب درس به درس همه رو ببینین به نظرم برای هر کدوم یه کورس ببینین که ته قسمت ۷ شما یه شهود کلی نسبت به دیتا ساینس داشته باشین بعد برگردین این دانش پایه‌ای‌تون رو مرمت کنین:) مخصوصا اگه دانشجوی مهندسی هستین پیشنهاد میکنم مستقیم برین سراغ قسمت ۶و۷


@DataScience_Golchin
170 viewsPeyman Naseri, edited  20:46
باز کردن / نظر دهید
2022-06-15 05:29:20 سلام امیدوارم حالتون روال باشه :)

بدون مقدمه چرا گلچین علم داده؟
راستش من که الان خیر سرم یه نیمچه دیتا ساینتیست محسوب میشم، قبلن (تو دوران لیسانسم) که میخواستم بیام تو این مسیر چالش‌های زیادی داشتم با این حال مهم تریناشون پیدا کردن یه roadmap درست و درمون بود مثلن اینکه پیشنیاز های ورود به این زمینه چی هستن و با چه ترتیبی باید رفت سراغشون و تو این راه چه منابعی مناسبن و ... خلاصه کلی ازم وقت گرفت مخصوصا اینکه الان به واسطه اینترنت و فضای مجازی تعدد منابع باعث سردرگمی بیشتر میشه به هر حال تصمیم گرفتم یه کانالی بزنم و تجربه هامو به مرور بزارم توش شاید به درد کسی خورد

ضمنن پست ها آپدیت میشن و از همین پیام پایینی ترتیب رو دنبال کنین
آی دی کانال :
@DataScience_Golchin

گروه:
@DataScience_Golchin_gp

کانال فایل ها:
@DataScience_Golchin_Files

آی دی خودم:
@peyman886
782 viewsPeyman Naseri, edited  02:29
باز کردن / نظر دهید