Machine learning (ML) HADOOP система, базирана на PYTHON

  Предоставяне на лицензиран софтуер, програмен код в първичен вид ( C#, Python) и конфигурационни файлове, служещи като база за бъдещо развитие на система Machine learning (ML)HADOOP.
Процедура за работа с набор от тригери по данни в Hadoop: Процедурата се изпълнява през определен период от време (ОПВ) например първоначално 1 секунда. ОПВ може да се променя периодично от ML системата, отговарящ на характера на данните (напр. средна величина до момента).
1) Създаване на външна таблица от данни от Hadoop, от които се правят тригерите. Една външна таблица съдържа от 1 до n тригера, представляващ набор от тригери. Допустимо е да има групи от такива външни таблици, които да могат да се създават от различни множества от данни. Всяко множество е съставено от данни в Hadoop с единен „date-timestamp“ параметър, служещ като Primary Key на външната таблица.
2) Добавяне нов ред в таблица (същата структура), но In-memory (създава се много-редова таблица с Primary Key „date-timestamps“ параметъра).
3) Сравнение на последния добавен ред с предишния съществуващ. Създава се флаг резултат от сравнението:
equal;
– different.
При different на съответен тригер, активира зададената Stored Procedure (при дефинирането на тригер се задава име на Stored Procedure, която да се активира при промяна на съдържанието на тригера). Разликата между двете „date-timestamp“ на двата реда (PM2P) се извежда към ML системата.
ML системата се състои от интерфейс с Процедурата за работа с тригери (написана на Python, описана по-горе), която чрез Python управляващ код прави връзката с Python библиотека, например: Scikit-learn, TensonFlow:
1) Нова PM2P (получена от Процедурата)
 2) Обучена PM2P(получена от Python  библиотеката)
3) ОПВ={Средна величина | (Обучена PM2P) /4 | …}
4) Предава се ОПВ на Процедурата
Изграждане на конфигурацията за „OLTP in MEMORY“.
Стъпки на конфигурацията:
 1) Идентифициране на таблицата „in memory“
 2) Създаване на „Columnstone indexes“ за всеки тригер
3) Свързване на SQL Server 2017 Analytics Services с „Таблицата in memory“

Партиден номер:  #YL3002610

Цената на годишен лиценз се изразява в 2000EURO без начислен ДДС.