Введение
- ICO можно считать инновационным способом получения финансирования, продвигаемым предпринимательскими компаниями, которые основывают свои бизнес-проекты на новой технологии, известной как блокчейн.
- До настоящего времени было создано более 1700 криптовалют, но не все из них успешны или характеризуются значительным влиянием.
- ICO выпускают «токены», т. е. единицу выбранной криптовалюты, в обмен на плоскую криптовалюту, чтобы принять участие в краудфандинге компании.
- Токены можно купить напрямую на веб-платформе компании на разных этапах ICO, обычно называемых предпродажей и продажей.
- Позже купленные токены можно продать или использовать в будущем для получения продуктов или услуг.
- Портал Tokendata.io подсчитал, что до 2017 года ICO собрали около 5,3 миллиарда долларов по всему миру; если мы учтем венчурных капиталистов, то в 2016 году они вложили 71,8 миллиарда долларов в Соединенных Штатах и 4,3 миллиарда долларов в Европе (National Venture Capital Association и Invest Europe).
- Стартапы и существующие предприятия обращаются к альтернативным источникам капитала в отличие от классических каналов, таких как банки или венчурные капиталисты.
- Они могут предложить внутреннюю ценность своего бизнеса, продавая «токены», т. е. единицы выбранной криптовалюты, как это обычно делает обычная фирма с помощью первичного публичного размещения (IPO).
- Когда мы говорим о криптовалюте, мы имеем в виду цифровую валюту, новое средство обмена, наиболее популярными примерами которой являются Биткойн и Эфириум.
- Блокчейн (цепочка блоков) — это технология, лежащая в основе криптовалюты; это распределенная технология распределенного реестра, определяемая как распределенная, общая, зашифрованная база данных, которая служит необратимым и неподкупным хранилищем информации (Wright and De Filippi, 2015).
- В настоящее время Биткойн является крупнейшей сетью блокчейнов, за ним следуют Эфириум, XRP, Лайткойн, EOS и Биткойн Кэш (Coinmarketcap, 2018).
- ICO способствуют разработке проектов с открытым исходным кодом и децентрализованному бизнесу, создавая встроенную базу клиентов и положительные сетевые эффекты.
- Они также создают вторичный рынок, где токены могут использоваться в качестве вознаграждения за использование приложения компании или предлагаемых услуг (Subramanian, 2018).
Методология
- В этой работе мы используем два типа информации: структурированную и неструктурированную.
- Что касается первой, мы используем классические модели статистической классификации, чтобы различать статус ICO, который состоит из 3 классов, предназначенных следующим образом:
- Успех: ICO собирает предопределенный хард-кеп в течение временного периода кампании;
- Неудача: ICO не собирает предопределенный хард-кеп в течение временного периода кампании;
- Мошенничество: ICO обнаруживается как мошенническая деятельность с вредоносным умыслом во время кампании и описывается как таковая на всех платформах, которые мы используем для сбора данных (а именно, ICObench и Telegram).
- Логистическая регрессия направлена на классификацию зависимой переменной в две группы, характеризующиеся разным статусом [1 = мошенничество против 0 = успех или 1 = успех против 0 = неудача] в соответствии со следующей моделью:
- Рассматривая текстовый анализ чатов Telegram, мы используем количественный анализ человеческих языков для выявления общих черт письменного текста.
- В частности, анализ относительно коротких текстовых сообщений, таких как те, которые появляются на платформе микроблогов, представляет собой ряд проблем.
- Некоторые из них — это неформальный разговор (например, сленговые слова, повторяющиеся буквы, смайлики) и уровень подразумеваемых знаний, необходимых для понимания тем обсуждения.
- Более того, важно учитывать высокий уровень шума, содержащийся в чатах, о чем свидетельствует тот факт, что только часть из них по сравнению с общим количеством доступных используется в нашем анализе настроений.
- Мы применили подход мешка слов (BoW), согласно которому текст представлен как неупорядоченный набор слов, учитывая только их количество в каждом комментарии чата.
- Векторизация слов и документов была выполнена путем сбора всех частот слов в матрице «Термин-документ» (TDM).
- Впоследствии такая матрица была взвешена с использованием популярного алгоритма TF-IDF (частота вхождения в текст — обратная частота в наборе документов).
- Были внедрены классические процедуры очистки текста, такие как удаление стоп-слов, пунктуации, ненужных символов и пробелов, добавление конкретных слов темы.
- В исследовательских целях мы использовали облака слов для каждого чата Telegram в соответствии с общим содержанием и по определенным подкатегориям, таким как настроения и выраженные настроения.
- Наиболее критическая часть анализа основана на классификации настроений.
- В целом можно использовать два разных подхода:
- Основанный на словаре оценок: оценочная оценка основана на количестве совпадений между предопределенным списком положительных и отрицательных слов и терминов, содержащихся в каждом текстовом источнике (твит, предложение, целый абзац);
- Основанный на классификаторе оценок: надлежащий статистический классификатор обучается на достаточно большом наборе предварительно помеченных примеров, а затем используется для прогнозирования класса настроения нового примера.
- Однако второй вариант редко осуществим, поскольку для построения хорошего классификатора требуется огромное количество предварительно классифицированных примеров, и это представляет собой особенно сложную задачу при работе с коротким и чрезвычайно нетрадиционным текстом, таким как чаты в микроблогах (Cerchiello и Никола, 2018).
- До сих пор мы решили сосредоточиться на подходе, основанном на словаре, адаптируя соответствующие списки положительных и отрицательных слов, относящихся к темам ICO, на английском языке.
- Мы используем три словаря из R
Пульс Новости 8 из 10
- **Значимость новости: 8** – Новые исследования в области определения успешных ICO являются значимыми для инвесторов и разработчиков.
- **Инновационная ценность новости: 9** – Представлен новый подход к анализу текста, который может быть полезен для прогнозирования успеха ICO.
- **Потенциальное влияние новости на рынок: 8** – Исследование может повысить осведомленность инвесторов о факторах успеха ICO и помочь им принимать более обоснованные решения.
- **Релевантность новости: 10** – Ность напрямую связана с криптовалютным рынком и интересует инвесторов.
- **Актуальность новости: 9** -Ность основана на недавних данных и анализе современных тенденций.
- **Достоверность новости: 7** – Ность основана на академическом исследовании, но размер выборки невелик.
- **Общий тон новости: 8** – Тон новости объективный и информативный.
8
ln(pi1-pi)=α+∑jβjxij, (1)
где pi – вероятность интересующего события для ICO i, xi = (xi1, …, xij, …, xiJ) – вектор объясняющих переменных, специфичных для ICO, параметр перехвата α, а также коэффициенты регрессии βj для j = 1 , …, J подлежат оценке по имеющимся данным.
Отсюда следует, что вероятность успеха (или мошенничества) можно получить следующим образом:
pi=11+exp-(α+∑jβjxij), (2)
Поскольку целевая переменная естественным образом категоризируется по трем классам: успех, неудача и мошенничество, мы расширяем вышеупомянутую бинарную логистическую регрессию до многомерной.
Такая модель оценивает все интересующие категории одновременно следующим образом:
ln(pk1-pK)=αk+∑jβkxij, (3)
где pk — вероятность k-го класса для k = 1, …, K при условии, что ∑Kpk=1.