Внеочередной пост
Грёбаный Экибастуз!
Коан #2
У семейства Смитов двое детей, один из них мальчик.
1) Какова вероятность, что второй тоже мальчик?
2) Изменится ли вероятность, если мальчик, про которого мы знаем - старший?
Ответы обоснуйте.
UPD Считаем по-простому, что девочки/мальчики равновероятно рождаются, без учёта генетики\монозиготности и пр. Это математическая задача.
1) Какова вероятность, что второй тоже мальчик?
2) Изменится ли вероятность, если мальчик, про которого мы знаем - старший?
Ответы обоснуйте.
UPD Считаем по-простому, что девочки/мальчики равновероятно рождаются, без учёта генетики\монозиготности и пр. Это математическая задача.
Революционная ситуация
Если коротко перефразировать Владимира Ильича, то такая ситуация создаётся, когда верхи по-старому управлять уже не могут, а низы не хотят жить в такой обстановке. Ну и плюс происходит некий повод, когда всё приходит в движение.
Но есть ещё важный нюанс, про то, кто такие эти низы и верхи. Отцы-теоретики имели перед глазами только общества с традиционно-аграрной поло-возрастной пирамидой, другие им было взять неоткуда. Вот эта пирамида (кажется, автор даже пытался отфильтровать только губернии, вошедшие потом в Россию):Не смотрите на типичную "пилу Чурова" (резкие выплески на круглых числах, что говорит о том, что данные в этих местах придумывали) - это не только особенности национальной статистики, но и реалии времени. С метриками и грамотностью населения было не очень, приходилось как-то примерно прикидывать возраст. Кстати, для этой переписи использовались перфокарты, и считающие их электрические машины.
( Collapse )
Но есть ещё важный нюанс, про то, кто такие эти низы и верхи. Отцы-теоретики имели перед глазами только общества с традиционно-аграрной поло-возрастной пирамидой, другие им было взять неоткуда. Вот эта пирамида (кажется, автор даже пытался отфильтровать только губернии, вошедшие потом в Россию):Не смотрите на типичную "пилу Чурова" (резкие выплески на круглых числах, что говорит о том, что данные в этих местах придумывали) - это не только особенности национальной статистики, но и реалии времени. С метриками и грамотностью населения было не очень, приходилось как-то примерно прикидывать возраст. Кстати, для этой переписи использовались перфокарты, и считающие их электрические машины.
( Collapse )
(no subject)
Говорят, новый Версаль. Но с виду скорее усадьба в Кусково. Версаль, он, простите, 420 метров длиной. Считали, например, что если к современному бюджету Франции, то строительство вышло в 260 млрд. евро (23 триллиона рублей). Всё-таки, сильно другие масштабы.
Новый год - новые вопросы

Нужна помощь зала
Дорогие друзья датасаентисты, укротители искусственных интеллектов, лингвисты-информатики и проч.(или если знаете такого - спросите у него пож-та).
Вот допустим я, навосхищавшись IBM Watson года с 2011, хочу шагнуть за край текущего прогресса и задавать вопросы на естественном языке о массиве русского текста в 500кБ (ну, для начала 50). Что бы можно было тут применить?
Попробовал дотренировывать ruGPT-3, но ей что-то эти пробные 50кБ как слону дробина, никакого видимого влияния не оказывают. Да и кажется генераторы, они не для этого - попробовал обучить генератор с нуля, да, он продолжает вход кусками из учебных текстов, но это довольно далеко от "отвечать на вопросы", даже поиск по ключевикам даст лучший результат.
Так вот - что бы применить здесь? Говорят, именно для ответов на вопросы нужен BERT: https://towardsdatascience.com/bert-nlp-how-to-build-a-question-answering-bot-98b1d1594d7b
Но у меня чот сомнения, что учёба на "ответах к коротким отрывкам текстов" даст внятный результат на "ответах к 500кБ". Да и где русский массив размеченный для этого взять...
Вот допустим я, навосхищавшись IBM Watson года с 2011, хочу шагнуть за край текущего прогресса и задавать вопросы на естественном языке о массиве русского текста в 500кБ (ну, для начала 50). Что бы можно было тут применить?
Попробовал дотренировывать ruGPT-3, но ей что-то эти пробные 50кБ как слону дробина, никакого видимого влияния не оказывают. Да и кажется генераторы, они не для этого - попробовал обучить генератор с нуля, да, он продолжает вход кусками из учебных текстов, но это довольно далеко от "отвечать на вопросы", даже поиск по ключевикам даст лучший результат.
Так вот - что бы применить здесь? Говорят, именно для ответов на вопросы нужен BERT: https://towardsdatascience.com/bert-nlp-how-to-build-a-question-answering-bot-98b1d1594d7b
Но у меня чот сомнения, что учёба на "ответах к коротким отрывкам текстов" даст внятный результат на "ответах к 500кБ". Да и где русский массив размеченный для этого взять...
(no subject)
Не прошло и 5 лет, и я снова балуюсь нейросетями.
На этот раз, помимо прочего, восстановление старых фотографий. Кстати, пользуясь случаем, угадайте исторического деятеля.
И кстати, воздаю хвалу Google и её Colab. Я подумывал, не проапгрейдить мне комп для этих целей - нужна гораздо более мощная видеокарта, чем у меня. Но Гугл позволяет совершенно бесплатно считать такие задачи у них в облаке на солидных мощностях. Но, воздаю хвалу и Microsoft, которая выложила в открытый доступ алгоритм, что я использую. Обнадёживающий пример сотрудничества корпораций на базе открытых технологий.
Что написано пером
Мы так давно привыкли, что какая угодно информация скорее всего уже есть в интернете. Книги, фильмы, статьи, мемуары, хроники. Однако эта привычка может сыграть с нами злую шутку. Информацию теперь очень легко тиражировать, и какая-нибудь неточность, лакуна может незаметно распространиться, заполнить собой все поисковики, и, всё - оригинал будет очень тяжело, или даже невозможно найти.
Я тут увлёкся мемуарами маркиза де Коленкура - "Поход Наполеона в Россию". И вот в третьей главе, "На Москву", видим что часть текста явно выпала, а момент прямо скажем кульминационный - Бородино:
"Этот трофей доставил большое удовольствие императору, но ему казалось непонятным, как могло случиться, что захвачено так мало пленных, когда редуты были взяты с такой стремительностью и окружены были со всех сторон кавалерией Неаполитанского короля. Он выразил неудовольствие по этому поводу и задал в связи
Его величество немедленно поскакал галопом к головным рядам кавалерии, чтобы найти там Неаполитанского короля и осуществить те маневры, которые он считал необходимыми для закрепления и развития этого успеха."
И всё, на всех ведущих ресурсах, где выложен текст, так же. Даже в аудиокнигах этот разрыв оставлен, и без комментариев.
И вот вопрос - переводной оригинал у кого-то остался вообще?
Я тут увлёкся мемуарами маркиза де Коленкура - "Поход Наполеона в Россию". И вот в третьей главе, "На Москву", видим что часть текста явно выпала, а момент прямо скажем кульминационный - Бородино:
"Этот трофей доставил большое удовольствие императору, но ему казалось непонятным, как могло случиться, что захвачено так мало пленных, когда редуты были взяты с такой стремительностью и окружены были со всех сторон кавалерией Неаполитанского короля. Он выразил неудовольствие по этому поводу и задал в связи
Его величество немедленно поскакал галопом к головным рядам кавалерии, чтобы найти там Неаполитанского короля и осуществить те маневры, которые он считал необходимыми для закрепления и развития этого успеха."
И всё, на всех ведущих ресурсах, где выложен текст, так же. Даже в аудиокнигах этот разрыв оставлен, и без комментариев.
И вот вопрос - переводной оригинал у кого-то остался вообще?
Они были роботы. Или как нас хотят эксплуатировать в новой реальности.
В детстве (а я помню себя с довольно малых лет) мне довольно часто снились кошмары. Лейтмотив в них как правило, был такой. Я ощущал себя в окружении неживой материи, которая изображала из себя живую. Например, разговаривали вещи. Такая, знаете, Лавкрафтовская хтонь. Потом я научился управлять снами, и всё ушло. Иногда правда бывало, что мне снилась например школа, и я осознавал, что вот эти люди вокруг, их поведение и слова обращённые ко мне, всё это мой сон, они не настоящие - тоже довольно жуткое ощущение.
И вот, попалась мне реклама вебинара на интересную тему, бесплатного. Я перешёл к странице "записаться" и оказалось, что он уже через полчаса начнётся. Надо же, как совпало, подумал я. И вот начался вебинар, ведущий, конечно же, проводил интерактив с чатом, так сейчас положено. Но, я обратил внимание, что с моими сообщениями интерактив как-то не идёт. Возникли смутные сомнения. Потом ведущий предлагал перейти смотреть с телефона на ПК, чтобы, значит, не отвлекаться. И, внезапно, на ПК оказалось, что вебинар опять начнётся через час :) Так глупо прокололись.
Идея, конечно, гениальная. Всякий онлайн в нашей действительности стал очень актуален. Но смотреть в записи, это совсем другое, чем с живым ведущим, который тратит на тебя своё время, поэтому вебинары сильно популярнее. Мало нам роботов, которые звонят на телефон, теперь ещё и это. О дивный новый мир, блин.
Сама "запись лекции" затянутая, плохо структурированная, банальная и манипулятивная, что характерно.
И вот, попалась мне реклама вебинара на интересную тему, бесплатного. Я перешёл к странице "записаться" и оказалось, что он уже через полчаса начнётся. Надо же, как совпало, подумал я. И вот начался вебинар, ведущий, конечно же, проводил интерактив с чатом, так сейчас положено. Но, я обратил внимание, что с моими сообщениями интерактив как-то не идёт. Возникли смутные сомнения. Потом ведущий предлагал перейти смотреть с телефона на ПК, чтобы, значит, не отвлекаться. И, внезапно, на ПК оказалось, что вебинар опять начнётся через час :) Так глупо прокололись.
Идея, конечно, гениальная. Всякий онлайн в нашей действительности стал очень актуален. Но смотреть в записи, это совсем другое, чем с живым ведущим, который тратит на тебя своё время, поэтому вебинары сильно популярнее. Мало нам роботов, которые звонят на телефон, теперь ещё и это. О дивный новый мир, блин.
Сама "запись лекции" затянутая, плохо структурированная, банальная и манипулятивная, что характерно.