ماتریسها و مشتق: کرونکر در سرزمین ماتریسها
گفته شد که وقتی مشتق نسبت به ماتریسها را مشتق نسبت به وکتورایز شدهی آنها در نظر بگیریم (همان عملگر ) دیگر لازم نیست با تنسورها و کووکتر و کنتراوکتورها سر و کله بزنیم. در عین حال لازم است ضرب کرونکر را از آن دنیا به این دنیا بیاوریم. ضرب کرونکر در محاسبات تنسوری، یک تنسور با ابعادی برابر با مجموع ابعاد تنسورهای ورودیاش ایجاد میکند. مثلاً ضرب کرونکر دو بردار یک ماتریس است. اما در دنیای ماتریسها ضرب کرونکر صورت سادهتری دارد.
اگر دو ماتریس و داشته باشیم، ضرب کرونکر آنها بصورت زیر تعریف میشود:
به عنوان مثال:
این ضرب خواص زیبایی دارد که در زمینهی مشتقگیری نسبت به ماتریس، خاصیت زیر یکی از مهمترینهاست:
برای مثالی از کاربرد این رابطه، فرض کنید میخواهیم از نسبت به مشتق بگیریم:
مشتقهای زنجیرهای و مشتق ضرب توابع
در دنیای اسکالرها کلی رابطه برای مشتقات وجود داشت که کار راهانداز بودند. این روابط به شکلهای مشابهی در دنیای ماتریسها هم برقرارند. یکی از آن رابطهها، رابطهی ضرب اسکالر و جمع بود که در پُست پیشین به آن اشاره کردم.
بد نیست علت برقراری آن رابطه را ببینیم:
به همین ترتیب میتوان مشاهده کرد که مشتق زنجیرهای از توابع بصورت زیر قابل محاسبه است:
و بصورت عامتر:
ظاهراً کسانی که قاعدهی ضرب ماتریس را بصورت ضرب سطر اولی در ستون دومی تعریف کردهاند، بنای درستی را نهادهاند! همه چیز با هم جور در میآید.
اما در مورد ضرب دو تابع روابط چگونهاند؟
اگر از بررسی عنصر به عنصر مشتق خسته شدهاید، حق دارید؛ من هم خسته شدم. برای همین از استاد کرونکر کمک میگیریم تا این یکی را بیابیم. اول تابع را در نظر میگیریم. مشتق این تابع نسبت به و با استفاده از رابطهی کرونکر بصورت زیر قابل محاسبه است:
با این حساب مشتق میشود:
اینکه ماتریسهای همانی مربوط به و را با یک نماد نوشتم، نباید باعث شود که فرض کنید هر دو ابعاد یکسانی دارند. ماتریس که در ضرب کرونکر میشود ابعادی برابر دارد و بالعکس.
نکتهی کوچکی هست که صحبتش را بکنیم، پروندهی این پُست را بستهایم. ما در مورد عملگر صحبت کردیم، اما در مورد اثر ترانهاده بر این عملگر چیزی نگفتیم. مثلاً وقتی بخواهیم مشتق را نسبت به محاسبه کنیم:
مقدار چه میشود؟ آیا رابطهای با دارد؟ خب معلوم است که سؤال هجو پرسیدهام و رابطه دارند اما چه رابطهای؟
برای مثال یک ماتریس ۳ در ۳ را نگاه کنیم:
رابطهی این دو ماتریس را میشود اینطور نوشت:
ماتریسهای متشکل از یک ۱ در هر سطر، ماتریسهای بازترتیب(permutation) هستند. کارشان این است که سطرهای بردار (یا ماتریس)ی که در آن ضرب میشوند را در ترتیب دیگری قرار میدهند. ما در جبر ماتریسی به ماتریس بازترتیبی که را به تبدیل کند، ماتریس میگوییم. اما چیزی که باقی مانده بود؛ مشتق ضرب کرونکر. تحوهی محاسبهی این یکی را بیایید بیخیال شویم. فقط بدانیم که مشتق ضرب کرونکر نتیجهای مثل زیر دارد:
این دفعه ابعاد ماتریسهای همانی و را نوشتم چون اگر ننویسیمشان احتمال قاطی شدن همه چیز با هم بالا میرود و قیمهها درون ماستها میریزد. عبارت بالا با فرض آن است که ابعادش و ابعادش است.
خب، پرونده کرونکر را هم بستیم، در پست بعدی به توابعی مثل معکوس و دترمینان ماتریس خواهیم پرداخت تا در آخرین پست، چند نمونه مسأله را با این ابزارهایی که صحبتشان شد، حل کنیم.