چند هفتهی اخیر، اخبار فناوری بیشتر دربارهی DeepSeek بوده است؛ مدل زبانی بزرگی از چین که به عنوان پاسخ این کشور به نمونههای غربی مطرح شده و در عین حال، تأثیر زیادی بر ارزش بازار داشته است. اما چه چیزی DeepSeek را از ChatGPT متمایز میکند؟ آیا تنها مزیت آن هزینهی کمتر اجراست یا ویژگیهای بیشتری دارد؟
در واقع، DeepSeek فقط یک نسخهی ارزانتر و کپیشده از مدلهای غربی نیست، بلکه یک رقیب جدی است که نوآوریهایی داشته و پیشرفتهای واقعی در مدلهای هوش مصنوعی ایجاد کرده است.
زنجیرهی تفکر (Chain of Thought)
مشابه انسانها، مدلهای زبانی بزرگ (LLM) نیز برای حل مسائل پیچیده نیاز به پردازش مرحلهبهمرحله دارند. درست مانند زمانی که شما نمیتوانید یک معادلهی دشوار را مستقیماً حل کنید و باید گامبهگام به نتیجه برسید. در هوش مصنوعی، این فرآیند “زنجیرهی تفکر” نام دارد و یکی از عوامل کلیدی برای تولید پاسخهای باکیفیت در چتباتها محسوب میشود.
زنجیرهی تفکر ممکن است همان جایی باشد که DeepSeek بیشترین پیشرفت را نسبت به GPT داشته است. این مدل نهتنها قادر است معماهای پیچیده را حل کند (مانند این مثال)، بلکه روند حل مسئله را به شکلی رضایتبخش نمایش میدهد.
به جای اینکه فقط یک پاسخ دریافت کنید، DeepSeek به شما امکان میدهد که مراحل پردازش و استدلال آن را بررسی کنید. این قابلیت به شما اجازه میدهد در صورت نارضایتی از پاسخ، درخواست تغییر دهید یا سؤالات بیشتری در مورد نحوهی رسیدن به آن پاسخ مطرح کنید. این یک ویژگی قدرتمند و ابزار بسیار مفیدی برای کاربران است.
کشینگ (Caching)
یکی دیگر از جنبههایی که DeepSeek را به رقیبی جدی برای GPT تبدیل میکند، قابلیت کشینگ (Caching) یا ذخیرهی موقت سؤالات و پاسخها است. این ویژگی به کاربران اجازه میدهد زنجیرهای از پرسشها را ایجاد کنند.
OpenAI، شرکت سازندهی ChatGPT، کشینگ را به دلیل هزینههای بالا محدود کرده است. به همین دلیل، بسته به طرح اشتراک شما، فقط تعداد مشخصی از سؤالات را میتوانید مطرح کنید قبل از اینکه چتبات حافظهی خود را پاک کند.
DeepSeek این مشکل را با استفاده از فناوریای به نام Content Caching on Disk حل کرده است. این فناوری ورودیهای تکراری را شناسایی میکند، به این ترتیب میتواند پاسخهای قبلی را بازیابی کند، بهجای اینکه هر بار پاسخ جدیدی تولید کند. این روش باعث کاهش محاسبات اضافی میشود، هزینههای DeepSeek را پایین میآورد و به کاربران امکان میدهد زنجیرههای طولانیتری از سؤالات را ایجاد کنند.
طبق گفتهی امیل ژروه، یکی از مدلسازان هوش مصنوعی، DeepSeek همچنین شفافیت بالایی در مورد دادههایی که ذخیره میکند، دارد. کاربران میتوانند ببینند که چه اطلاعاتی ذخیره شده و چه چیزی ذخیره نمیشود، که به آنها کمک میکند پرامپتهای بهتری طراحی کنند. این ما را به نکتهی آخر میرساند.
بهینهسازی پرامپتها
نتیجهی بهبود کشینگ و زنجیرهی تفکر این است که ایجاد پرامپتهای بهتر آسانتر میشود. ژروه میگوید که شفافیت DeepSeek در مورد نحوهی عملکردش، به کاربران کمک میکند تا دستورات بهتری برای هوش مصنوعی بنویسند.
بهعنوان مثال، هنگام نوشتن یک پرامپت، میتوانید اطلاعاتی را که تغییر نخواهند کرد، در ابتدای متن قرار دهید. این کار باعث میشود DeepSeek بتواند آن دادهها را ذخیره و مجدداً استفاده کند. در مقابل، دادههایی که ممکن است تغییر کنند، بهتر است در وسط یا انتهای پرامپت قرار بگیرند تا پاسخها شفافتر و دقیقتر باشند.
البته، این موضوع چیزی نیست که یکشبه متوجه شوید، و شاید برای کاربران عادی چندان مفید نباشد. اما این نشان میدهد که DeepSeek با GPT متفاوت است و صرفاً یک نسخهی ارزانتر و تقلیدی نیست. آنچه OpenAI آغاز کرده بود، شاید در نهایت توسط یک شرکت چینی که تا چند ماه پیش کسی نامش را نشنیده بود، تکمیل شود.