Введение
Initial Coin Offerings (ICOs) представляют собой инновационный способ получения финансирования, используемый предпринимательскими компаниями, которые основывают свои бизнес-проекты на новой технологии, известной как блокчейн. На сегодняшний день было создано более 1700 криптовалют, но не все из них успешны или оказывают существенное влияние.
ICOs выпускают “токены”, т.е. единицы выбранной криптовалюты, в обмен на стандартную криптовалюту для участия в краудфандинге компании. Токены можно купить напрямую на веб-платформе компании на разных этапах ICO, обычно называемых предпродажей и продажей. Позже купленное количество токенов можно продать или использовать в будущем для получения продуктов или услуг. Портал Tokendata.io подсчитал, что до 2017 года ICO привлекли около 5,3 миллиарда долларов по всему миру; если рассматривать венчурный капитал, то в 2016 году они инвестировали 71,8 миллиарда долларов в Соединенных Штатах и 4,3 миллиарда долларов в Европе (National Venture Capital Association и Invest Europe).
Стартапы и существующие предприятия обращаются к альтернативным источникам капитала в отличие от традиционных каналов, таких как банки или венчурные капиталисты. Они могут предложить внутреннюю ценность своего бизнеса путем продажи “токенов”, т.е. единиц выбранной криптовалюты, как это делает обычная фирма с помощью первичного публичного размещения (IPO). Когда мы говорим о криптовалюте, мы имеем в виду цифровую валюту, новый способ обмена, наиболее популярными примерами которой являются Bitcoin и Ethereum.
Блокчейн (цепочка блоков) – это технология, лежащая в основе криптовалюты; это распределенная технология реестра, определяемая как распределенная, общая, зашифрованная база данных, которая служит необратимым и неподкупным хранилищем информации (Wright and De Filippi, 2015). Bitcoin в настоящее время является самой большой сетью блокчейн, за которой следуют Ethereum, XRP, Litecoin, EOS и Bitcoin Cash (Coinmarketcap, 2018).
ICOs поддерживают разработку проектов с открытым исходным кодом и децентрализованный бизнес, создавая встроенную клиентскую базу и положительные сетевые эффекты. Они также создают вторичный рынок, где токены могут использоваться в качестве вознаграждения за использование приложения компании или предлагаемых услуг (Subramanian, 2018).
Методология
В этой статье мы используем два типа информации: структурированную и неструктурированную. Что касается первой, мы используем классические модели статистической классификации для различения статуса ICO, который состоит из 3 классов, обозначенных следующим образом:
• Успех: ICO собирает заранее заданный хард-кеп в течение временного горизонта кампании;
• Неудача: ICO не собирает заранее заданный хард-кеп в течение временного горизонта кампании;
• Афера: ICO обнаруживается как мошенническая деятельность со злым умыслом во время кампании и описывается как таковая на всех платформах, которые мы используем для сбора данных (а именно ICObench и Telegram).
Проверка надежности маркировки аферы осуществляется путем проверки того, объявили ли регулирующие органы о правовых действиях против эмитентов (например, официальные объявления SEC о нарушении закона).
Логистическая регрессия направлена на классификацию зависимой переменной в две группы, характеризующиеся разным статусом [1 = афера против 0 = успех или 1 = успех против 0 = неудача] в соответствии со следующей моделью:
ln(pi1-pi)=α+∑jβjxij, (1)
где pi – вероятность интересующего события для ICO i, xi = (xi1, …, xij, …, xiJ) – вектор особых для ICO пояснительных переменных, параметр перехвата α, а также коэффициенты регрессии βj, для j = 1, …, J, должны быть оценены по имеющимся данным. Отсюда следует, что вероятность успеха (или аферы) можно получить следующим образом:
pi=11+exp-(α+∑jβjxij), (2)
Поскольку целевая переменная естественным образом классифицируется по трем классам: успех, неудача и афера, мы расширяем вышеупомянутую бинарную логистическую регрессию до многочленной. Такая модель оценивает все интересующие категории одновременно следующим образом:
ln(pk1-pK)=αk+∑jβkxij, (3)
где pk – вероятность k-го класса для k = 1, …, K при условии, что ∑Kpk=1.
Рассматривая текстовый анализ чатов Telegram, мы используем количественный анализ человеческого языка для обнаружения общих черт письменного текста. В частности, анализ относительно коротких текстовых сообщений, таких как те, которые появляются на платформе микроблогов, представляет ряд проблем. Некоторые из них – это неформальный разговор (например, жаргонизмы, повторяющиеся буквы, смайлики) и уровень подразумеваемых знаний, необходимых для понимания тем обсуждения. Кроме того, важно учитывать высокий уровень шума, содержащегося в чатах, о чем свидетельствует тот факт, что только малая их часть по отношению к общему доступному количеству используется в нашем анализе настроений.
Мы применили подход под названием Bag of Word (BoW), согласно которому текст представляется как неупорядоченный набор слов, учитывающий только их количество в каждом комментарии чата. Векторизация слов и документов была выполнена путем сбора всех частот слов в матрице документов терминов (TDM). После этого такая матрица была взвешена с использованием популярного алгоритма TF-IDF (частота-обратная частота документа). Были применены классические процедуры очистки текста, такие как удаление стоп-слов, пунктуации, ненужных символов и пробелов, добавление определенных слов по теме. В описательных целях мы использовали облака слов для каждого чата Telegram в соответствии с общим содержанием и определенным подкатегориям, таким как настроения и выраженные настроения.
Самая важная часть анализа основана на классификации настроений. В целом можно использовать два разных подхода:
• На основе словаря оценок: оценка настроения основана на количестве совпадений между заранее определенным списком положительных и отрицательных слов и терминов, содержащихся в каждом текстовом источнике (твит, предложение, целый абзац);
• На основе классификатора оценок: надлежащий статистический классификатор обучается на достаточно большом наборе предварительно помеченных примеров, а затем используется для прогнозирования класса настроений нового примера.
Однако второй вариант редко осуществим, поскольку для того, чтобы соответствовать хорошему классификатору, требуется огромное количество предварительно классифицированных примеров, и это представляет собой особенно сложную задачу при работе с короткими и крайне нетрадиционными текстами, такими как чаты микроблогов (Cerchiello and Nicola, 2018). Таким образом, мы решили сосредоточиться на подходе на основе словаря, адаптировав соответствующие списки положительных и отрицательных слов, относящихся к темам ICO, на английском языке. Мы используем три словаря из пакета R “tidytext”:
• AFINN от Финна Арупа Нильсена;
• BING от Бинга Лю и сотрудников;
• NRC от Сайфа Мохаммада и Питера Терни.
Эти лексиконы основаны на однограммах, т.е. отдельных словах, они содержат много английских слов, и слова помечены оценками для положительного/отрицательного настроения, а также возможно и эмоциями, такими как радость, гнев, печаль и т.д. Лексикон NRC разделяет слова по принципу “да”/”нет” на категории положительных, отрицательных, гнева, предвкушения, отвращения, страха, радости, печали, удивления и доверия. Лексикон BING классифицирует слова по принципу “да/нет” на положительные и отрицательные категории. Лексикон AFINN присваивает словам оценку, которая колеблется от -5 до 5, причем отрицательные оценки указывают на отрицательное настроение, а положительные оценки указывают на положительное настроение. Применяя вышеописанные лексиконы, мы получаем для каждого ICO оценку настроения, а также подсчет положительных и отрицательных слов. Все эти индексы используются в качестве дополнительных предикторов в рамках логистических моделей.
Данные
В этой статье мы рассматриваем 196 ICO, начиная с января 2017 года по ноябрь 2018 года. Для
Пульс Новости 7.6 из 10
- **Значимость новости: 8** – Новость рассматривает важный аспект рынка ICO и предоставляет аналитические результаты, которые могут заинтересовать участников рынка.
- **Инновационная ценность новости: 7** – Новость применяет аналитические методы к неструктурированным данным, что является инновационным подходом к анализу ICO.
- **Потенциальное влияние новости на рынок: 6** – Результаты исследования могут оказать влияние на стратегии принятия решений инвесторами и создателями ICO, а также на регулирование рынка.
- **Релевантность новости: 10** – Новость полностью посвящена теме ICO и представляет собой актуальные данные и анализ.
- **Актуальность новости: 9** – Хотя исследование охватывает период до 2018 года, выводы остаются актуальными для современного рынка ICO.
- **Достоверность новости: 8** – Новость основана на академических исследованиях, которые прошли рецензирование, и данные собраны из надежных источников.
- **Общий тон новости: 6** – Новость имеет нейтральный тон, представляя как положительные, так и отрицательные аспекты рынка ICO.