Introduction
- ICOs представляют собой новаторский способ финансирования, продвигаемый предпринимательскими компаниями, которые основывают свои бизнес-проекты на новой технологии, известной как блокчейн.
- На сегодняшний день было создано более 1700 криптовалют, но не все из них успешны или отличаются значительным влиянием.
- ICOs выпускают «токены», то есть единицу выбранной криптовалюты, в обмен на фиксированную криптовалюту, чтобы принять участие в краудфандинге компании.
- Токены можно приобрести непосредственно на веб-платформе компании на разных этапах ICO, обычно называемых предварительной продажей и продажей.
- Позже купленные токены можно продать или использовать в будущем для получения продуктов или услуг.
- Портал Tokendata.io подсчитал, что до 2017 года ICO привлекли около 5,3 млрд долларов по всему миру; если учитывать венчурных капиталистов, то в 2016 году они инвестировали 71,8 млрд долларов в США и 4,3 млрд долларов в Европе (National Venture Capital Association и Invest Europe).
- Стартапы и существующие предприятия обращаются к альтернативным источникам капитала в отличие от классических каналов, таких как банки или венчурные капиталисты.
- Они могут предложить внутреннюю ценность своего бизнеса, продавая «токены», то есть единицы выбранной криптовалюты, как это обычно делают фирмы через Первичное публичное размещение (IPO).
- Когда мы говорим о криптовалюте, мы имеем в виду цифровую валюту, новое средство обмена, наиболее популярными примерами которых являются Биткойн и Эфириум.
- Блокчейн (цепь блоков) — это технология, лежащая в основе криптовалюты; это распределенная, общая, зашифрованная база данных, которая служит необратимым и неподкупным хранилищем информации (Wright and De Filippi, 2015).
- Биткойн в настоящее время является крупнейшей сетью блокчейнов, за которой следуют Эфириум, XRP, Лайткоин, EOS и Биткойн Кеш (Coinmarketcap, 2018).
- ICOs способствуют развитию проектов с открытым исходным кодом и децентрализованному бизнесу, создавая встроенную клиентскую базу и положительные сетевые эффекты.
- Они также создают вторичный рынок, где токены можно использовать в качестве вознаграждения за использование приложения компании или предлагаемых услуг (Subramanian, 2018).
Методология
- В этой статье мы используем два вида информации: структурированную и неструктурированную.
- Что касается первого, мы используем преимущества классических моделей статистической классификации, чтобы выделить статусы ICO, которые состоят из 3 классов, намеченных следующим образом:
- Удача: ICO собирает заранее определенный хард-кап в течение временного горизонта кампании;
- Неудача: ICO не собирает заранее определенный хард-кап в течение временного горизонта кампании;
- Мошенничество: ICO обнаруживается как мошенническая деятельность со злонамеренными намерениями во время кампании и описывается как таковая всеми платформами, которые мы используем для сбора данных (а именно, ICObench и Telegram).
- Логистическая регрессия направлена на классификацию зависимой переменной в две группы, характеризующиеся разным статусом [1 = мошенничество против 0 = успех или 1 = успех против 0 = неудача] в соответствии со следующей моделью:
ln(pi1-pi)=α+∑jβjxij, (1)
- где pi — вероятность события, представляющего интерес, для ICO i, xi = (xi1, …, xij, …, xiJ) — вектор объясняющих переменных, специфичных для ICO, перехватывающий параметр α, а также коэффициенты регрессии βj для j = 1, …, J, которые необходимо оценить по имеющимся данным.
- Из этого следует, что вероятность успеха (или мошенничества) можно получить как:
pi=11+exp-(α+∑jβjxij), (2)
- Поскольку целевая переменная по своей природе классифицируется по трем классам: успех, неудача и мошенничество, мы расширяем вышеупомянутую бинарную логистическую регрессию до многомерной.
- Такая модель оценивает все интересующие категории одновременно следующим образом:
ln(pk1-pK)=αk+∑jβkxij, (3)
- где pk — вероятность k-го класса для k = 1, …, K при условии, что ∑Kpk=1.
- Рассматривая текстовый анализ чатов Telegram, мы используем количественный анализ человеческих языков для обнаружения общих черт письменного текста.
- В частности, анализ относительно коротких текстовых сообщений, таких как те, которые появляются на платформах микроблогов, представляет ряд проблем.
- Некоторые из них — неформальная беседа (например, сленговые слова, повторяющиеся буквы, смайлики) и уровень подразумеваемых знаний, необходимых для понимания тем обсуждения.
- Кроме того, важно учитывать высокий уровень шума, содержащегося в чатах, что подтверждается тем, что только часть чата по отношению к общему количеству доступных используется в нашем анализе настроений.
- Мы применили подход Bag of Word (BoW), согласно которому текст представляется как неупорядоченный набор слов, учитывая только их количество в каждом комментарии чата.
- Векторизация слова и документа была выполнена путем сбора всех частот слов в матрице «Термин-документ» (TDM).
- Впоследствии эта матрица была взвешена с использованием популярного алгоритма TF-IDF (частота терминов, обратная частота документов).
- Были реализованы классические процедуры очистки текста, такие как стоп-слова, пунктуация, удаление ненужных символов и пробелов, добавление специальных слов темы.
- Для наглядности мы использовали облака слов для каждого чата Telegram в соответствии с общим содержанием и конкретным подкатегориям, таким как настроения и выраженные настроения.
- Самая критическая часть анализа опирается на классификацию настроений.
- В целом можно использовать два разных подхода:
- Основанный на словаре оценок: оценка настроения основана на количестве совпадений между предопределенным списком положительных и отрицательных слов и терминов, содержащихся в каждом текстовом источнике (твит, предложение, целый абзац);
- Основанный на классификаторе оценок: надлежащий статистический классификатор обучается на достаточно большом наборе предварительно помеченных примеров и затем используется для прогнозирования класса настроений нового примера.
Сбор данных
- В этой статье мы исследуем 196 ICO с января 2017 года по ноябрь 2018 года.
- Для каждого проекта мы собираем информацию из веб-источников, в основном рейтинговых платформ, таких как icobench.com, TokenData.io, ICO Drops.com, CoinDesk.com и веб-сайты проектов.
- Процесс создания набора данных ICO отражает основные этапы запуска ICO: от зарождения бизнес-идеи до формирования команды, цели токенов, технических требований (технический документ), продвижения и этапа исполнения.
Сбор структурированных данных
- Первый шаг в сборе данных о каждом проекте — собрать информацию с наиболее используемых платформ, связанных с ICO, таких как Icobench, TokenData, Coinschedule или аналогичных.
- Оригинал новости
Пульс Новости 7.3 из 10
- Значимость новости: 8. Новость анализирует ключевые факторы успеха и неудачи ICO, что является важной темой для криптовалютного рынка.
- Инновационная ценность новости: 7. Новость использует новые подходы к анализу ICO, включая текстовый анализ чатов Telegram.
- Потенциальное влияние новости на рынок: 6. Новость может помочь инвесторам принимать обоснованные решения об ICO и может повлиять на регулирование ICO.
- Релевантность новости: 8. Новость высоко релевантна для криптовалютного рынка и интересует инвесторов, разработчиков и регулирующие органы.
- Актуальность новости: 9. Новость была опубликована в 2020 году и содержит последние данные об ICO.
- Достоверность новости: 8. Новость опубликована в авторитетном рецензируемом журнале и основана на данных из различных источников.
- Общий тон новости: 7. Общий тон новости нейтральный и объективный, без выраженного предвзятого отношения.
- Источник новости: 8. Новость опубликована в респектабельном журнале Frontier in Artificial Intelligence.
7.3