Онлайн білім берудегі кеңес беру жүйелері. Ұсынатын жүйе жасырын деректерді жинау мысалдары

Рекомендациялық жүйенің не екенін анықтаудан бастайық. Бұл пайдаланушылардың не көргісі келетінін анықтауға тырысатын және оларға оны ұсынатын (немесе ұсынатын, сондықтан атауы) бағдарламалар мен қызметтер. Әрқайсымыз әртүрлі сайттарда осындай трюктерді кездестірген болуымыз керек. Бүгін біз мұндай бағдарламалардың түрлерін, жұмыс істеу принципін сипаттайтын боламыз, сонымен қатар осы алгоритмдердің әрекеттегі мысалдарын келтіреміз. Соңына дейін оқыңыз, қызық болады!

Жоғарыда біз кеңес беру жүйелерінің не екенін сипаттадық, енді олардың қаншалықты маңызды екендігі туралы толығырақ сөйлесетін боламыз. Бұл бағдарламалар сайттың келушілермен өзара әрекеттесу тәсілін жақсартты, себебі пайдаланушы статикалық ақпаратты берудің орнына интерактивті тәжірибе алады.

Ұсынымдар әрбір адам үшін олардың белгілі бір веб-ресурстағы алдыңғы әрекеттеріне немесе бұрынғы әрекетіне негізделген жеке жасалады. Сонымен қатар, процеске бұрынғы қатысушылардың мінез-құлқы да маңызды.

Интернет-дүкендер үшін бұл негізінен маңызды функция, және Amazon сияқты үлкен каталогтар үшін - сапалы жұмыс істеудің бірнеше әдістерінің бірі. Ұсыныс әдісі бұл жағдайжалпыға ортақ қосымша опция емес, ол веб-ресурс арқылы пайдаланушы шарлауының ыңғайлылығын қамтамасыз етеді. Егер а Сандық каталог 20 000-нан астам өнім түрі бар, бағдарлау қазірдің өзінде өте қиын болып көрінеді, миллиондаған тауар болса, мен не айта аламын?

Қаншалықты шаршатады әлеуетті сатып алушыұқсас сайтпен өзара әрекеттесу? Жауабы анық. Сіз іздегенге көрнекі түрде ұқсас немесе бір өнім тобына жататын өнімдерді немесе қосымша өнімдерді іздеуге арналған виджет (мысалы, сөмкені таңдау үшін жұп аяқ киім ұсынылғанда) көмекке келеді. . Бұл шешім көру санын көбейтіп қана қоймайды, конверсияға оң әсер етеді.

Тәжірибе көрсеткендей, бұл әдісті тек интернет-дүкендер ғана пайдаланбайды. Әлеуметтік желі де артта қалған жоқ. Төменде ВКонтактедегі мысал келтірілген.

Сондай-ақ, мұндай әдістерді әртүрлі әлеуметтік платформаларда, әдебиетке арналған порталдарда, саяхатта, жаңалықтар ресурстарында, интернет-дүкендерде, бір сөзбен айтқанда - барлық жерде оңай көруге болады. Бұл техника өте танымал. Kinopoisk веб-ресурсы қол жетімді тағы бір мысал.

Техникалар

Сонымен, бірінші түрі - нақты деректер жинау. Аты бойынша болжауыңыз мүмкін, пайдаланушының өзі жұмысқа қажетті материалдарды береді. Мысалы, Яндекстің немесе басқа іздеу жүйелерінің кеңес беру жүйелері адамнан әртүрлі элементтерді бағалауды, белгілі бір аймақта таңдаулылар тізімін жасауды немесе бірнеше сұрақтарға жауап беруді сұрағанда. Егер адам өз бетімен ақпарат беруден бас тартса, келесі әдістеме өзекті болады.

Екінші түрі - жасырын деректерді жинау. Салыстырмалы түрде айтқанда, бұл тыңшылық миссия, оған сәйкес процеске қатысушының әрекеттері одан әрі өңдеу және қолдану үшін бағдарламамен жазылады. Бұл үшін не қажет? Бағдарлама сатып алуларды, сайттардағы рейтингтерді таниды, көріністер, пікірлер туралы ақпаратты жинайды. Әрине, мұндай техниканы таңдау кейбіреулерге әкеледі этикалық мәселелер, себебі жеке деректерді қорғау пайдаланушының іздеу жүйелеріне қойылатын негізгі талаптарының бірі болып табылады. Бірақ факт сақталғанымен, бақылаудың бір түрі болуы мүмкін және сайтқа қарапайым келушілер мұндай оқиғалардың шынымен болып жатқанын тексере алмайды.

Бірінші негізгі әдіс бірлескен сүзу деп аталады. Бұл әдістемені қолдану бойынша ұсыныстар бір адамның немесе адамдар тобының мінез-құлық ерекшеліктеріне негізделген шығарылады, соңғысы одан да тиімді. Топтар бір-біріне мінез-құлқы мен мінез-құлқы жағынан ұқсас адамдарды жинайды.

Ақпаратты түсінуді жеңілдету үшін мысал келтірейік. Музыкалық шығармалар көрерменге ұсынылатын веб-сайт құрылуда. Бұл жағдайда бірлескен әдістемеге негізделген ұсыныстар қызметтері қалай жұмыс істейді? Бұл принцип бойынша: қатысушылар бір жанрдағы тректерді ойнату тізіміне қосатын бір қауымдастық негізге алынады. Әрі қарай, барлық музыкалық шығармалардың ең танымалы анықталып, бұл әуенді әлі тыңдамаған топтың бір пайдаланушысына ұсынылады.

Екінші тәсіл мазмұнға негізделген сүзу деп аталады. Мұнда ұсыныс адам мінез-құлқы негізінде қалыптасады. Бұл тәсілді пайдаланған кезде белгілі бір қатысушының шолу тарихы да негізге алынуы мүмкін.

Бұл жолы тақырыптық онлайн журналдармен мысал келтіреміз. Сонымен, адам бұрын тау велосипеді туралы материалдарды оқып, осындай мазмұндағы блог мақалаларына үнемі түсініктеме берген жағдайда, мазмұнды сүзу әдісі осы өткен ақпаратты ұқсас ресурстарды анықтау және оларды осы пайдаланушыға ұсыныс ретінде ұсыну үшін пайдаланады.

Сондай-ақ аралас тәсілдер бар, оларға сәйкес ұсынымдық жүйені әзірлеу жүзеге асырылады.

Аралас тәсіл – бірлескен және мазмұнды сүзгілеудің тіркесімі. Өздеріңіз білетіндей, көбірек жақсырақ, сондықтан осы екі әдісті араластыру ұсынымдар жүйесінің тиімділігін арттырады, атап айтқанда, олар нақты адамдар үшін болжамдардың дәлдігін айтарлықтай арттырады.

Алгоритмдер

Пирсон корреляциясы

Бұл алгоритм таңдауға мүмкіндік береді Жалпы сипаттамаларбірнеше пайдаланушылар арасында. Қалайша? Қарапайым математиканың көмегімен, атап айтқанда екі элемент арасындағы сызықтық байланысты анықтау. Маңызды сәт - бұл техника адамдар қауымдастығына жарамайды.

Кластерлеу

Рекомендациялық жүйелердің жұмыс істеу принципі элементтердің (пайдаланушылардың) мүмкіндіктері деп аталатын кеңістікте бір-біріне жақындығын есептеу арқылы олардың арасындағы ұқсастықты бөліп көрсетуге негізделген. Белгілер - белгілі бір процеске қатысушылардың мүдделері біріктірілетін элементтер (музыкалық ресурстар үшін бұл тректер, кинопорталдар, фильмдер үшін). Ұқсас сипаттамалары бар пайдаланушылар кластерлер деп аталатын топтарға біріктірілген.

Бірлескен сүзгілеу алгоритмі

Қатты кластерлеуді басқа алгоритммен ауыстыруға болады, ол өте күрделі формула бойынша жұмыс істейді және барлық алдыңғылар сияқты, өз тобындағы пайдаланушылардың мінез-құлқына негізделген. Дегенмен, бұл техниканың бірнеше маңызды кемшіліктері бар. Біріншіден, жаңа немесе типтік емес пайдаланушылар (бірге топтамайтындар) үшін ұсыныстар табу қиын. Екіншіден, «суық старт» деп аталатын, жаңа нысандар кеңес беру жүйелеріне енбеген кезде.

Мазмұнды сүзу алгоритмі

Алгоритм алдыңғыға симметриялы, бірақ егер бірінші жағдайда біз пайдаланушыға объект ұнайды, өйткені оның «сыныптастары» ұнайды деген болжамнан бастасақ, онда біз бұл жерде ол бұрыннан атап өткен ұқсас нысандар негізінде ұсынамыз. өзі. Ал мұнда дәстүрлі түрде бірнеше мәселені анықтауға болады. Дәл сол «суық бастау» және ұсыныстардың жиі қарапайым болуы.

Қорытындының орнына

Сонымен, біз жаңадан бастаушы немесе қарапайым адам кеңес беру жүйелері туралы білуі керек барлық ақпаратты бердік. Ашығын айтайық, алгоритмдер дайын емес адам үшін біршама қиын, сондықтан алгоритмдер соларға негізделгенімен, бұл мақалада математикалық формулалар жоқ.

Ұсыныс бағдарламалары қарапайым интернет пайдаланушылары үшін де, зерттеушілер мен онлайн бизнесмендер үшін де пайдалы қызметтер болып табылады. Түрлендірулер мен көріністер санын арттырғысы келетіндер бұл әдістемеге назар аударып, веб-ресурстың, әсіресе интернет-дүкеннің тиімділігін арттыру үшін оны міндетті түрде жүзеге асыруы керек.

Ұсынушы жүйелерді құрудың екі негізгі стратегиясы бар: мазмұнды сүзу және бірлескен сүзу.

Сағат мазмұнды сүзуқұрылды профильдерпайдаланушылар мен объектілер.

  • Пайдаланушы профильдері демографиялық ақпаратты немесе белгілі бір сұрақтар жинағына жауаптарды қамтуы мүмкін.
  • Нысан профильдері жанр атауларын, актер атын, орындаушы атын және т.б. - объектінің түріне байланысты.

Бұл әдіс жобада қолданылады Музыкалық геном жобасы: Музыкалық талдаушы әрбір әнді пайдаланушының музыкалық қалауларын анықтау үшін пайдаланылуы мүмкін жүздеген әртүрлі музыкалық сипаттамаларға сәйкес бағалайды.

Сағат бірлескен сүзгілеубұрынғы пайдаланушы әрекеті туралы ақпарат пайдаланылады - мысалы, сатып алулар немесе рейтингтер туралы ақпарат. Бұл жағдайда сіз қандай нысандар түрлерімен жұмыс істеп жатқаныңыз маңызды емес, бірақ профильді құру кезінде ескеру қиын болатын жасырын сипаттамалар ескерілуі мүмкін. Ұсынушы жүйелердің бұл түріндегі негізгі мәселе «суық бастау» болып табылады: жүйеде жақында пайда болған пайдаланушылар немесе объектілер туралы деректердің болмауы.

Әдістеме

Айқын деректерді жинау мысалдары

  • пайдаланушыдан объектіні сараланған шкала бойынша бағалауды сұрау;
  • пайдаланушыдан объектілер тобын жақсыдан ең нашарға қарай бағалауды сұрау;
  • қайсысы жақсы деген сұрақпен пайдаланушыға екі нысанды ұсыну;
  • пайдаланушы ұнататын нысандардың тізімін жасау ұсынысы.

Жасырын деректерді жинау мысалдары

  • пайдаланушының интернет-дүкендерде немесе дерекқорлардың басқа түрлерінде не көріп жатқанын бақылау;
  • желіде қолданушылардың мінез-құлқының жазбаларын жүргізу;
  • пайдаланушы компьютерінің мазмұнын қадағалау;

Қолдану

Ұсыну жүйелері әртүрлі адамдардан алынған деректердің бір түрін салыстырады және белгілі бір пайдаланушыға арналған ұсыныстар тізімін есептейді. Олардың коммерциялық және коммерциялық емес пайдалануының кейбір мысалдары бірлескен сүзгілеу мақаласында келтірілген. Ұсыну жүйелері іздеу алгоритмдеріне ыңғайлы балама болып табылады, өйткені олар соңғы кезде табылмайтын объектілерді табуға мүмкіндік береді. Бір қызығы, кеңес беру жүйелері әдеттен тыс деректерді индекстеу үшін іздеу жүйелерін жиі пайдаланады.

  • Имхонет (фильмдер, әдебиеттер, фотосуреттер)
  • Last.fm (музыка)
  • Озон (кітаптар, компакт-дискілер және т.б.)
  • Software Informer (бағдарламалық құрал)
  • Ғылыми фантастика зертханасы (Ғылыми фантастика және фантастика веб-сайты)
  • Imdb - фильмдер (ағылшын тіліндегі веб-сайт)
  • Речелпер - фильмдер
  • Advizzer - орындар
  • Mir4 - кез келген мазмұнмен, соның ішінде шағын таралыммен жұмыс істеуге қабілетті эксперименттік жүйе. Әзірге ол тек жаңалықтармен жұмыс істейді.

Сілтемелер

Ескертпелер

Әдебиет

  • Мелвилл П., Муни Р., Нагаражан Р.Жақсартылған ұсыныстар үшін мазмұнды күшейтілген бірлескен сүзгілеу // Техас университеті, АҚШ: Материалдар конф. / AAAI-02, Остин, TX, АҚШ, 2002. - 2002. - S. 187-192.

Викимедиа қоры. 2010 ж.

    Ғылыми-практикалық қызмет саласы, библиография түрлерінің бірі (Әдебиеттер тізімін қараңыз). Р.б.-ның негізгі қоғамдық мақсаты. КСРО және басқа да социалистік елдерде жалпы және кәсіби білімжәне өзін-өзі тәрбиелеу ... Ұлы Совет энциклопедиясы

    URL: http://imhonet.ru Коммерциялық: Жоқ Түрі ... Wikipedia

    Бұл мақалада осы сәтМүше: Мошанин белсенді өңдеген. Бұл хабарландыру жойылмайынша, оған ешқандай өзгертулер енгізбеңіз. Әйтпесе, өңдеу қайшылықтары туындауы мүмкін. Бұл ... ... Уикипедия - Бұл бетті Атом энергиясы жөніндегі халықаралық агенттік деп өзгерту ұсынылады. Себептерді түсіндіру және Уикипедия бетіндегі талқылау: Аты өзгертілмек / 24 шілде 2012 ж. Мүмкін оның қазіргі атауы қазіргі ... Уикипедия стандарттарына сәйкес келмейтін шығар.

    БАЛА ӘДЕБИЕТІНІҢ БИБЛИОГРАФИЯСЫ- библиография бөлімі, оның міндеттеріне бухгалтерлік есеп және балалар мен жастарға арналған баспа жұмыстары туралы ақпарат кіреді. Бұл ақпарат екі негізгі түрде жіберіледі мекен-жайлары: ересектер (мұғалімдер, ата-аналар, тәрбиешілер, кәсіби ... ... байланысты мамандар. Орыс педагогикалық энциклопедиясы

    Ел экономикасы- (Халық шаруашылығы) Ел экономикасы – елдің әл-ауқаты мен азаматтарының әл-ауқатын қамтамасыз ету жөніндегі қоғамдық қатынастар Ұлттық экономиканың мемлекет өміріндегі рөлі, ел экономикасының мәні, функциялары, салалары мен көрсеткіштері; елдердің құрылымы ...... Инвестор энциклопедиясы

    Өтімділік- (Өтімділік) Өтімділік – міндеттемелерді үздіксіз төлеу мүмкіндігін қамтамасыз ететін активтердің қозғалғыштығы Экономикалық сипаттамасыжәне кәсіпорынның, банктің, нарықтың, активтер мен инвестициялардың өтімділік коэффициенті маңызды экономикалық ... ... Инвестор энциклопедиясы

2016 жылдың 28 сәуірінде біз Stepic.org сайтында Python тапсырмаларын студенттің деңгейіне қарай таңдайтын бірінші бейімделу курсының басталғанын ресми түрде жарияладық. Бұған дейін біз студенттердің аяқтағандарын ұмытпауы және оларды қызықтыруы мүмкін жаңа тақырыптарды ашуы үшін платформада ұсынылған сабақтарды іске асырдық.

Кесудің астында екі негізгі тақырып бар:

  • онлайн білім беру, жақсы/жаман жақтары/тұңқырлар туралы;
  • рекомендациялық жүйелердің классификациясы, олардың білім беруде қолданылуы, мысалдары.

Онлайн білім беру туралы, оның жақсы жақтары, кемшіліктері және қателері

Бұл бөлім кіріспе, онлайн білім беруді, келесі суреттегі кеңес беру жүйелерінің қызықты мәліметтерін сипаттайды :)

Қазіргі әлемде онлайн білім беру біртіндеп танымал бола бастады. Жетекші профессорлардан білім алу мүмкіндігі оқу орындары, үйден шықпай-ақ жаңа салаларды меңгеру, жұмысқа қажетті білімді алу көптеген адамдарды тартады.

Онлайн оқытудың ең кең таралған түрлерінің бірі - жаппай ашық онлайн курстары (MOOCs). Көбінесе олар мұғалім дайындаған бейнероликтерді, слайдтарды және мәтіндік мазмұнды, сондай-ақ әдетте автоматты түрде тексерілетін білімді тексеруге арналған тапсырмаларды қамтиды, бірақ студенттер бір-бірінің жұмысын тексеруге мүмкіндік береді. Тапсырмалар ретінде тапсырмалардың алуан түрлері ұсынылуы мүмкін: бастап қарапайым таңдауэссе жазбас бұрын дұрыс жауап және тіпті бізде Степикте болғандай, автоматты тексеруі бар бағдарламалау тапсырмалары.

Онлайн білім берудің оны әдеттегі, офлайн білім беруден ерекшелендіретін өзіндік ерекшеліктері бар. Артықшылықтардың ішінде, біріншіден, Интернетке қол жеткізе алатын барлық адамдар үшін жоғарыда айтылған қолжетімділік. Екіншіден, бұл дерлік шексіз масштабтау: автоматтандырылған тапсырмаларды тексерудің арқасында мыңдаған адамдар курста бір уақытта оқи алады, бұл дәстүрлі курстармен салыстыруға келмейді. сыныптар. Үшіншіден, әрбір студент материалды өтуге ыңғайлы уақыт пен қарқынды таңдай алады. Төртіншіден, мұғалімдерде пайдаланушылардың курстарды қалай өткізетіні туралы деректердің үлкен көлемі бар, олар өз материалдарын талдау және жақсарту үшін пайдалана алады.

Сонымен қатар, онлайн оқытудың кейбір кемшіліктері бар. Дәстүрлі білім беруден айырмашылығы, студент әрқашан өзінің оқу үлгерімін бағалау түріндегі мотивацияға ие болады, онлайн курстар жағдайында курсты аяқтамағаны үшін айыппұлдар қарастырылмаған. Осыған байланысты курсты аяқтағандардың оған жазылушылардың үлесі сирек 10%-дан асады (Степикте бізде EdCrunch Awards 2015 нұсқасы бойынша Анатолий Карповтың «Статистика негіздері» ең жақсы курсы бар, бұл рекорд. Бірінші ұшыруға жазылғандардың 17%, бірақ бұл ерекшелік). Сонымен қатар, оқушы санының көптігіне байланысты мұғалімнің әр оқушыға өз деңгейіне, мүмкіндігіне қарай жеке көңіл бөлуге мүмкіндігі жоқ.


Біз өз алдымызға студентке оны қызықтыратын мазмұн бойынша кеңес бере алатын және оның дайындық деңгейі мен біліміндегі олқылықтарды ескеретін кеңес беру жүйесін құру міндетін қойдық. Сонымен қатар, жүйе мазмұнның күрделілігін бағалай білуі керек. Бұл, атап айтқанда, қолданушыға материалды оқуға, оған икемді бейімделуге, дәл қазір оқуға қажетті мазмұнды ұсынуға көмектесетін бейімделу ұсыныстары үшін қажет. Мұндай жүйе пайдаланушыларға белгілі бір тақырыпты үйренуге немесе жаңа нәрсені ұсынуға көмектесетін жекелендірілген сабақ ұсыныстарымен пайдалы болады.

Жалпы, оқу одан да қызықты болуы керек еді!

Ұсынушы жүйенің алғашқы заманауи үлгілерінің бірі - movielens.org, ол пайдаланушыларға олардың қалаулары бойынша фильмдерді ұсынады. Бұл қызмет әр адамға фильмдер және пайдаланушылар берген рейтингтер туралы мәліметтердің кең жиынтығын беретіндігімен қызықты. Бұл деректер жинағы соңғы екі онжылдықта көптеген кеңес берушілердің зерттеулерінде пайдаланылды.

  • Мазмұнды сүзгілеуге негізделген жүйелер. Мұндай жүйелер пайдаланушыларға бұрын зерттеген мазмұнға ұқсас мазмұнды ұсынады. Ұқсастық салыстырылған объектілердің сипаттамалары арқылы есептеледі. Мысалы, фильмдерді ұсыну үшін жанр жақындығын немесе трансляцияны пайдалануға болады. Бұл тәсіл фильмдерді бағалау, іздеу және интернет-фильмдер дерекқорын ұсыну қызметінде қолданылады.
  • Бірлескен сүзуді пайдаланатын жүйелер. Бұл жағдайда пайдаланушыға ұқсас пайдаланушыларды қызықтыратын мазмұн ұсынылады. MovieLens ұсыныстары осы тәсілге негізделген.
  • Алдыңғы екі тәсілді біріктіретін гибридті жүйелер. Жүйенің бұл түрін онлайн фильмдер мен сериалдарды көруге арналған Netflix қызметі пайдаланады.

Біз мазмұнды сүзуді белсендірек пайдалану және бірлескен сүзуді азырақ пайдалану арқылы гибридті жүйені жасадық.

Technology Enhanced Learning үшін кеңес беру жүйелері туралы көптеген зерттеулер бар. Тапсырманың ерекшелігі бұл жағдайда кеңес беру жүйесін дамытудың жаңа бағыттарын қосады.


Білім беру жобасының рекомендациялық жүйесінің ерекшеліктері қандай?

Біріншіден, бұл белгілі бір сәтте пайдаланушының қажеттіліктеріне бейімделетін және оған материалды зерттеудің ең жақсы әдістерін ұсынатын адаптивті кеңес беру жүйесін құру мүмкіндігі. Бұл форматта, мысалы, математикада немесе кез келген бағдарламалау тілінде, әртүрлі күрделіліктегі көптеген тапсырмаларды қамтитын әртүрлі тренажерларды жүзеге асыруға болады, олардың ішінде әр түрлі студенттер кез келген уақытта қолайлы болады.

Екіншіден, пайдаланушылардың олар арқылы өтуі туралы деректерден оқу материалдары арасындағы тәуелділіктерді шығаруға болады.

Бұл деректер материалдардағы жеке тақырыптарды, осы тақырыптар арасындағы байланыстарды, олардың күрделілік қатынасын шығаруға көмектеседі.

Coursera, EdX, Udacity (онлайн оқу платформалары) пайдаланушыларға оларды қызықтыруы мүмкін курстар туралы кеңес беру үшін өздерінің кеңес беру жүйелерін пайдаланады. Бұл ұсыныстардың кемшілігі - олар тек бүкіл курсты ұсына алады, бірақ оның кейбір бөлігін емес, тіпті егер пайдаланушы тек оған қызығушылық танытса да. Сондай-ақ, осылай құрастырылған жүйе пайдаланушыға өзі таңдаған курсты оқуға көмектесе алмайды.

MathsGarden ресурсын ұсыну жүйесі, керісінше, мазмұнның ең кішкентай бөліктерімен - жеке тапсырмалармен жұмыс істейді. Бұл студенттерге арналған қарапайым арифметикадағы тренажер бастауыш мектеп, ол студентке күрделілігі бойынша берілген уақытта ең жақсы сәйкес келетін тапсырмаларды ұсынады.
Ол үшін жүйе оқушы білімінің салыстырмалы сипаттамасын, сондай-ақ тапсырмалардың күрделілігінің сипаттамасын есептейді және динамикалық түрде өзгертеді, бірақ бұл туралы кейінірек.

Келесі мақалаларда біз Stepic.org құрылғысы және кеңес беру жүйесін енгізу туралы толығырақ айтып, адаптивті кеңес беру жүйесінің не екенін анықтаймыз және нәтижелерді егжей-тегжейлі талдаймыз. Қызықты болады:)

Ұсыныс жүйелері әртүрлі ресурстарда оңай енгізіле бастаған кезде, бұл өзін-өзі іздеу процесіне жақсы қосымша болып көрінді. Өнімдерді немесе кез келген мазмұнды таңдау жеткілікті үлкен болған кезде, іздеу көбінесе күтпеген нәтижелермен қызықты саяхатқа айналады. Мысалы, мен қорқынышты фильмдерге ешқашан қызығушылық танытпадым, басқа бағыттағы фильмдерді ұнатамын, бірақ мазмұндағы кездейсоқ топтаманың арқасында мен бір күні классикалық фильмге тап болдым. Hellraiser, кездейсоқ қарау маған күшті және ұмытылмас әсер қалдырды. Кездейсоқ ізденіс пен кездейсоқ әрекеттердің арқасында оқырмандардың әрқайсысы кем дегенде бір рет мәдени немесе эстетикалық мағынада байығанына сенімдімін. Екінші жағынан, тақырыптық ресурстар беретін ұсыныстардың көмегімен өзім үшін көптеген қызықты нәрселер аштым. Көптеген фильмдер, кітаптар, музыка немесе өнімдер маған белгілі болды (және қызықты) ұсыныс жүйесінің сәтті жұмыс істеуі арқасында. Айтпақшы, қазір мен әрдайым дерлік ұсыныстарға сенемін және өз бетімше бірдеңе іздеймін, өйткені соңғысына уақыт жоқ!

Бұл жағдайды ұсынатын алгоритмдердің мені қаншалықты түсіне бастағанын көріп отырғандығым қиындатады. Егер бұрын сәтті хиттар жиі орын алмаса, бүгін ұсынылған нәрселердің кем дегенде жартысы мені бір дәрежеде қызықтырады. Маған ұсынылған нәрсені немқұрайлы қабылдаудың орнына, өзіме лайықты нәрсені табуға тырысқанда, мен керемет, бұрын-соңды болмаған молшылықтың қысымымен тез бас тартамын. Ал неғұрлым алыс болса, айналадағы шындық сіздің тұлғаңызға үздіксіз бейімделіп, үнемі өзгеріп, үйренетін кезде соншалықты алыс емес болашақтың бейнесі соғұрлым айқынырақ болады. Адамзат тарихында ешқашан жайлылық мұндай қорқынышты абсолютті болған емес. Бұрын-соңды таңғажайып кездейсоқ табылған саңылаулар пайдаланудан соншалықты тез және үзілді-кесілді жойылған емес.

Алдағы болашақты сол күйінде қабылдай отырып, оны сыни тұрғыдан бағалауды, күмәнді немесе тіпті қараңғы жақтарды анықтауды үйренген жөн, біз күнделікті өмірде біздің тағдырымызды жеңілдететін инновацияларды қолдануға тырысамыз. Бүгінгі әңгімеміздің тақырыбын түсінуге тырысайық.

Рекомендациялық жүйелерде қолданылатын сүзгілеу әдістері

Бірлескен сүзгілеу

Бірлескен сүзгілеу кеңінен қолданылады, ең аз дегенде орындаудың салыстырмалы жеңілдігінен. Оның жұмыс істеу принципі шын мәнінде қарапайым, бірақ оны екі түрлі тәсілге бөлуге болады.

Пайдаланушыға негізделген тәсіл берілген пайдаланушының жүйеге қатысатын басқа пайдаланушыларға ұқсастығын ескереді. Мысалы, егер Василий Леди Гага, Оазис және Лед Зеппелинді оң бағаласа, онда Леди Гага мен Лед Цеппелинді жақсы көретін Анастасия Оазисті ұсынуға тырысуы мүмкін.

Объектілерді сәйкестендіру тұжырымдамасы (тиісінше элемент негізінде), керісінше, объектілердің өзін талдайды және олардың бір кездері Василийге ұнаған ұқсастығын ашады. Іс жүзінде бұл былай көрінеді - Василий бір кездері Radiohead және Blur ұнады, неге біз оған Оазисті де ұсынбаймыз?

Бірлескен сүзгілеу мінез-құлқы ұқсас пайдаланушылар арасындағы айырмашылықтарды талдау және салыстыру негізінде өте дәл және сәйкес ұсыныстарды алуға мүмкіндік береді.

Василий мен Анастасия: артықшылықтардағы айырмашылықтарға негізделген өзара автоматты ұсыныстар.

Мазмұнды сүзу

Мазмұнды сүзгілеу ұсынылатын тауарлар немесе кез келген мазмұн арасында ішкі сілтемелер жасайды. Бұл қарапайым принцип пайдаланушыға бұрын таңдаған объектілерге ұқсас объектілерді ұсынуда көрінеді. Мысалы, кітап дүкенінен гитара нұсқаулығын сатып алсаңыз, сізге автоматты түрде сол автордың басқа танымал оқулықтары немесе нұсқаулықтары ұсынылады. Мазмұнды сүзгілеу принципін пайдаланатын кеңес беру жүйелерінің үлкен плюс - жаңа пайдаланушыны оның алғашқы тұтынушылық қадамдарынан бастап ұсыныстарымен қызықтыру мүмкіндігі. Ұзақ уақыт бойы адамның қалауы туралы деректерді жинаудың қажеті жоқ, келушіні ресурспен жұмыс істеуге бірден қосуға болады. Сондай-ақ, мазмұнды сүзудің маңызды артықшылығы - пайдаланушыға басқа пайдаланушылар бағаламайтын және айналып өтетін нысандарды ұсыну мүмкіндігі. Соңғы нүкте көбінесе бірлескен әдісті қолданғанда орын алады.

Мазмұнды сүзу белгілі бір нысандар туралы пайдаланушылардың пікірлерін толығымен елемейді. Нысандардың арасында таза байланыс орнату арқылы біз рейтингтер мен қосымша жеке ақпаратты жинамай, адамға оны қызықтыратын позицияға ұқсас нәрсені бірден ұсынуға мүмкіндік аламыз. Пайдаланушы тәжірибесін ұсынымдық жүйеден негізгі субстанция ретінде алып тастау арқылы біз деп аталатын мәселені шешіп жатқан сияқтымыз. "суық бастау", пайдаланушы деректерінің сиректігі жүйеге жекелендірілген ұсыныстарды жасауға кедергі келтіретін кезде. Дегенмен арт жағымазмұнды сүзгілеу мүлдем орынсыз, кейде жай ғана күлкілі ұсыныстардан тұрады, мысалы: «Сіз Toyota RAV4 сатып алдыңыз ба? Сізді Toyota Highlander қызықтыруы мүмкін!»

Мазмұнды сүзгілеу принципін қолданумен байланысты тағы бір қиындық - жүйедегі барлық нысандар арасындағы қарым-қатынастарды құру бойынша жұмыстың әсерлі көлемі. Бірақ бұл әдістің негізгі кемшілігі нысанаға өте төмен, кейде өте шартты түрде соққы беруде көрінеді. Мазмұнды сүзу жекелендірудің жоғары дәрежесін білдірмейді, сондықтан ұсыныстардың дәлдігі салыстырмалы түрде төмен.

Білімге негізделген сүзгілеу (Білімнегізделген жүйелер)

Бұл түрдегі жүйелер интернет-дүкендерде кеңінен қолданылады. Негізінде, білімге негізделген ұсыныстар алдыңғы мазмұнды сүзгілеу әдісіне ұқсас, дегенмен мұндай алгоритмдер объектілерді тереңірек талдауды пайдаланады, олардың арасындағы ұқсастық критерийлері бойынша емес, белгілі бір өнім топтарының өзара байланысына негізделген.

Іс жүзінде бұл келесідей көрінеді - мысалы, смартфонды сатып алғанда, сайт сізге жаңа құрылғымен пайдалануға жарамды керек-жарақтарды ұсынады. Бұл қақпақтар, құлаққаптар, жад карталары және басқалар болуы мүмкін. Сіз сатып алушыны аксессуарларға жеңілдік беру арқылы қосымша ынталандыра аласыз, бұл жаңа құрылғыны сатып алуға байланысты өте пайдалы болуы мүмкін.

Білімге негізделген ұсыныстар жақсы нәтижелер көрсетіп, үлкен желінің айналымын арттыруда сауда алаңдарыондаған пайызға. Сонымен қатар, мазмұнды сүзуден айырмашылығы, бұл ұсыныс түрі бар жоғары дәлдік, пайдаланушыға шынымен пайдалы болатын нәрсені ұсынады.

Егер сіз нақты ұсыныстарға қызығушылық танытсаңыз, сіз өзіңіздің ресурста білімге негізделген жүйені енгізуді міндетті түрде қарастыруыңыз керек. Мазмұнды сүзгілеу сияқты, білімге негізделген кеңес беру жүйесі объектілер (өнімдер) арасындағы қарым-қатынастарды зерттейді және талдайды, бірақ, сонымен қатар, ол белгілі бір пайдаланушының жеке қасиеттеріне қатысты бірқатар қосымша опцияларды ескереді.

a) Пайдаланушының қалауы. Барлығына таныс жағдай - сайт пайдаланушыға қажетті сипаттамаларды көрсетуге шақырады, содан кейін ол сұранысқа сәйкес келетін өнімдерді ұсынады.

Yandex.Market және оның құсбелгілері пайдаланушы талаптарын басшылыққа алатын ұсыныстар жүйесінің жақсы және жарқын мысалы болып табылады.

б) Демографиялық ерекшеліктер.Іс жүзінде демографиялық деректерді ең үлкендер пайдаланады әлеуметтік желілер, мысалы, Facebook, LinkedIn, Vkontakte және т.б.

Әрине, мұндай жүйені енгізу үшін сізге көп жұмыс істеу керек - сізге үлкен көлемдегі деректерді жинауға және өңдеуге тура келеді.

Гибридті фильтрация

Ең қуатты және іске асыру қиын құрал. Шамасы, болашақ әртүрлі кеңес беру механизмдерін бір қуатты алгоритмге біріктіруде. Біз мақаланың басында айтқан абсолютті жайлылық пен жекелендірілген шындық ұсыныстардың ең тиімді әдістерінің гибридінің көмегімен жүзеге асырылады.

Мұндай мысалды Netflix ұсынады, оның бірегей дәлдікті көрсететін гибридті ұсыныстар жүйесі үнемі жетілдіріліп, жаңартылып отырады. Мұндай қуатты алгоритмнің дамуы негізінен Netflix-тің осы саладағы зерттеулерді жомарт қаржыландыруымен байланысты, ол 2006 жылы кеңес беру жүйесін 10%-ға жақсарту үшін 1 000 000 доллар ұсынған.

BellKor компаниясының алгоритмді жетілдіре алған Pragmatic Chaos әзірлеу тобыNetflix10,09%-ға.

Қорытынды ретінде практикалық қадамдар туралы бірнеше сөз

Сүзгілеудің белгілі бір түрін немесе бірнеше әдістердің комбинациясын таңдау тікелей екі факторға байланысты - жобаңыздың күрделілігіне және оны қаржыландыру көлеміне. Мысалы, тақырыптық, қиылысатын блогтар жүйесі үшін алгоритм құру салыстырмалы түрде қарапайым және орташа шығынды міндет болып табылады. Интернет-дүкендер сияқты үлкенірек және гетерогенді жобалар қымбатырақ, әсіресе егер мақсат конверсияны шынымен елеулі сомаларға арттыру болса. Әдетте, мұндай жобаларда ұсынатын алгоритмнің бір түрімен шектелу мүмкін емес және гибридті сүзгілеуді қолдануға тура келеді, соның нәтижесінде әзірлеудің құны мен күрделілігі шама бойынша өседі.

Гибридті алгоритмді жасау, енгізу және жөндеу үшін сізге сызықтық және реляциялық алгебраның не екенін жақсы білетін тәжірибелі әзірлеушілер тобы қажет, сонымен қатар кеңес беруші алгоритмдерді жасаушыларды іс жүзінде жеке кәсіпке айналдыратын бірқатар дағдыларға ие.

Қалай болғанда да, пайдаланушыға жалпы жиынтықтан нақты объектілерді таңдау мүмкіндігін ұсынатын жобаны әзірлеу кезінде барлық салаларда ыңғайлылықтың жылдам дамуын ескеру қажет. адам өмірі– ұйқы кезінде болып жатқан барлық процестерді талдайтын және оны жақсарту бойынша ұсыныстар беретін құрылғылардың көмегімен ұйқыны оңтайландырудан бастап, пайдаланушының ағымдағы қажеттіліктеріне негізделген күнделікті өнімдерді автоматты түрде таңдауға дейін. Өздеріңіз білетіндей, кез келген істің сәтті болуының таптырмас шарты – оның уақыт рухына дәл сәйкес келуі.