Павел 26

Насколько скоро можно получить ответ

51 сообщение в этой теме

Павел, ну чего ты прицепился :(, да еще и минута за минутой (посты твоих сообщений) :(

Как скоро приходят ответы на вопросы???

Как прочитает вопрос человек, владеющий им, так и отвечает, если считает нужным ответить. Форум - место общения, а не скорая помощь. Никто никому здесь ничем не обязан и это дело каждого тратить свое время на ответы и свои деньги на инет. Хинт: :) Напротив каждого поста проставляется время, вычитаем из времени ответа время помещения вопроса и строим распределение B) В хвосте распределения возможно будет "бин'' от некоторого T_{max} до бесконечности.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Математические замечания:1) строим не распределение, а гистограмму или полигон2) если строить именно распределение, оно будет дискретным, а знамомые мне ДСВ (дискретные случайные величины), наверное, плохо описали бы ситуацию3) интересен наиболее близкий тип распределения соответствующей абсолютно непрерывной СВ (хи-квадрат? логнормальное?)

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Кстати, pravdins, а не заняться ли Вам статистикой для форума? А? Я например обажаю всякие статистические данные, особенно в графическом виде.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Это интересно, но сбор статистики выльется в кучу трафика. Если кому-то действительно нужны результаты статрасчетов, можно прислать мне по почте архив rar/zip с таблицей excel и вопросами.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Ну это тогда к Виталику, возможно это и не нужно никому (кроме меня B)).

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Лакшми, а какая статистика интересует?

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Да любая! Я люблю все что связано с математикой, статистикой и дискреткой. Ну вот хотя бы скорость ответа на вопросы. Можно по отдельным форумам.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Админ веселится

Математические замечания:

1) строим не распределение, а гистограмму или полигон

Если произносится слово "бин", _очевидно_, что речь идет о гистограмме.

2) если строить именно распределение, оно будет дискретным

Характерное время обдумывания ответа, попадания вопроса на глаза консультанту, ухода темы в "подвал" много больше одной секунды, т.е. единственной частоты дискретизации :blink:(здесь админ вспомнил слова из прошлой жизни) :)

Так что можно обойтись непрерывным распределением, фитирующим гистограмму

3) интересен наиболее близкий тип распределения соответствующей абсолютно непрерывной СВ (хи-квадрат? логнормальное?)

Качественный вид распределения получается из простых соображений. Есть три характерных времени:

[*]Т_отв - время обдумывания ответа

[*]Т_ув - характерное время попадания в тему врача-консультанта,

[*]Т_ух - характерное время ухода темы с первой страницы

Можно попытаться фитировать гистограмму распределением вида:

dw/dt = N * ( 1 - exp(-t/T_отв)) * exp( - (t - T_отв*(1-exp(-t/T_отв))/Т_ув ) , при t < T_ух

dw/dt = 0, при t >= T_ух

где w(t) - вероятность получить первый ответ в интервале от 0 до t.

N подбираем так, что при Т_ух -> бесконечности w = [интеграл по t от 0 до бесконечности (нет подходящего символа)] (dw/dt) dt -> 1 (если тема никогда не уходит с глаз консультантов, то

вероятность получить ответ = 1)

Чтобы убедиться, что такое w(t) имеет смысл, смотрим на (dw/dt)/(1-w(t)), кАроче , лень писать, :flood: и видим что dw = (1 - w(t)) * (свертка от распределения времени ответа, которое обладает свойствами (*адын*)

Получите при подгонке этих самых Т_ух, Т_отв, Т_ув по построенной гистограмме chi2/d.o.f. порядка единицы - можно успокоиться и будет щастъе :( вида тыкать в график пользователей, вопрошающих "когда?"

Это интересно, но сбор статистики выльется в кучу трафика.

Запускать программку можно прямо на серверной машине, даже через морду форума - это чтобы не заморачиваться с запросами к базе.

man wget, man bash, man grep, man sed, etc. etc. Тоска то какая зеленая :cray:

Изваяете скриптик, можно попросить координатора прогнать его прямо на сервере.

Если кому-то действительно нужны результаты статрасчетов, можно прислать мне по почте архив rar/zip с таблицей excel и вопросами.

excel для обработки статистики :swoon:

Offtop.Сегодня День святого Патрика. У некоторых русскоязычных юниксоидов, сформировавшихся уже в эпоху IBM PC, сей праздник вызывает тихую радость :yahoo:

Ку сформировавшимся в ту же эпоху виндузятникам :tease:

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Если произносится слово "бин", _очевидно_, что речь идет о гистограмме.

Что такое "бин"? В моем матем. словаре этого слова нет.

Характерное время обдумывания ответа, попадания вопроса на глаза консультанту, ухода темы в "подвал" много больше одной секунды, т.е. единственной частоты дискретизации

Я вижу на экране время с точностью до минут. Вполне подходящий период дискретизации.

строим распределение

Тогда уж аппроксимируем.

Так что можно обойтись непрерывным распределением, фитирующим гистограмму

Что такое "фитировать"? Аппроксимировать?

excel для обработки статистики

Это ВЫ сказали, а не я. Excel - удобное средство представления и передачи числовых данных для статанализа.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Админ продолжает развлекаться, несмотря на прошедший праздник

Что такое "бин"? В моем матем. словаре этого слова нет.

бин = bin. Пардон за жаргон

Я вижу на экране время с точностью до минут. Вполне подходящий период дискретизации.

Характерные времена в задаче много больше одной минуты. Если ширину бина брать одна минута, то количество попаданий в каждый много больше 1 не получите. На самом деле, консультант жмет кнопку "отправить" в любой момент времени, которое, как мы верим, непрерывно. Не имеет смысл вводить дискретное распределение. Подгоняем непрерывное распределение по гистограмме с бинами шириной десятки минут, причем неравной ширины, вблизи максимума распределения помельче, в хвосте ширину бинов можно брать и несколько дней, и все. Желательно, чтобы количество попаданий в каждый бин было много больше квадратного корня из него же.

Шинковать с шириной одна минута имеет смысл только если мы сразу не подобрали ширины бинов так, чтобы их мелкость "следила" за распределением. Но тогда файл, который поедет к вам, будет преогромных размеров. Разумным выходом будет весь анализ проводить на серверной машине.

А с exсel это будет праздник жизни :cray: До чего же я люблю идейных пользователей виндовс :yahoo:

Что такое "фитировать"? Аппроксимировать?

Фитировать - подгонять свободные параметры аппроксимирующей функции.

Excel - удобное средство представления и передачи числовых данных для статанализа.

Вах :( Упал.

Как мне представляется, скриптик, просматривающий форум и складывающий в гистограмму разности времен ответов и вопросов, проще всего нарисовать так, чтобы он выдавал на стандартный вывод (или в дисковый файл) текст вида:

0 1 0

1 2 10

2 3 15

...

10 20 10

...

50 * 1

который совершенно незачем еще заглатывать в excel. Понимаю, что прогресс в программном обеспечении позволяет стрелять из пушки по воробьям :blink::flood:

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Не имеет смысл вводить дискретное распределение.

И я о том же!

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

[*]Т_отв - время обдумывания ответа

[*]Т_ув - характерное время попадания в тему врача-консультанта,

[*]Т_ух - характерное время ухода темы с первой страницы

Можно попытаться фитировать гистограмму распределением вида:

dw/dt = N * ( 1 - exp(-t/T_отв)) * exp( - (t - T_отв*(1-exp(-t/T_отв))/Т_ув ) , при t < T_ух

dw/dt = 0, при t >= T_ух

где w(t) - вероятность получить первый ответ в интервале от 0 до t.

N подбираем так, что при Т_ух -> бесконечности w = [интеграл по t от 0 до бесконечности (нет подходящего символа)] (dw/dt) dt -> 1 (если тема никогда не уходит с глаз консультантов, то

вероятность получить ответ = 1)

1)dw/dt называется плотностью вероятности распределения абсолютно непрерывной случайной величины

2)N подбираем так, чтобы интеграл от 0 до Т_ух был равен 1 (иначе это будет не плотность)

3)по смыслу задачи, вероятность получить ответ при большом наплыве вопросов и ответах консультанта лишь на вопросы с первой страницы не равна 1 при стремлении времени ожидания к бесконечности, а таких случайных величин не бывает; поэтому T_ух можно исключить из модели и заставить консультанта отвечать на все вопросы

4)Ваша формула для dw/dt плоха с точки зрения размерностей (нельзя из времени вычитать безразмерную величину T_отв*(1-exp(-t/T_отв))/Т_ув)

5)я взял среднее время ответа 8 часов и стандартное отклонение 1.5 часа; графики плотности и функции логнормального распределения меня в общем устроили; вероятность получить ответ за 6 часов равна 0.24, а за 12 часов - 0.84.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

1)dw/dt называется плотностью вероятности распределения абсолютно непрерывной случайной величины

:blink:

2)N подбираем так, чтобы интеграл от 0 до Т_ух был равен 1 (иначе это будет не плотность)

Неверно. Сумма вероятностей получить ответ при t<Т_ух + получить ответ при t>T_ух (+ не получить ответ вообще) = 1, так что нормировать интеграл dw/dt от нуля до Т_ух надо на число меньше единицы, т.к. явно предположили dw/dt = 0 при t>T_ух. Чем больше Т_ух, тем ближе к единице вероятность получить ответ при t < Т_ух.

При желании, рассмотрите случай с dw/dt =/= 0 при t>Т_ух (грубо при t>Т_ух dw/dt ~ (1-w(t)) * вероятность увидеть вопрос до ухода темы с первой страницы * плотность в хвосте распределения времени обдумывания ответа). Тогда при любом Т_ух можно честно нормировать на единицу интеграл dw/dt от нуля до бесконечности.

3)по смыслу задачи, вероятность получить ответ при большом наплыве вопросов и ответах консультанта лишь на вопросы с первой страницы не равна 1 при стремлении времени ожидания к бесконечности, а таких случайных величин не бывает;

:yahoo: Сумма вероятностей всех событий равна 1, среди возможных событий есть "не получить ответ вообще".

поэтому T_ух можно исключить из модели....

Неверно, :( см выше

....и заставить консультанта отвечать на все вопросы

Предложите способ заставить консультанта отвечать на все вопросы. Бесплатно на форуме и за свой счет оплачивая интернет

А он вас не отправит в дальнее пешее путешествие? :cray: И администрацию форума следом. "И пойдут они, солнцем палимы, повторяя: "Суди его бог"" (с) :flood:

4)Ваша формула для dw/dt плоха с точки зрения размерностей (нельзя из времени вычитать безразмерную величину T_отв*(1-exp(-t/T_отв))/Т_ув)

А посчитать количество вот таких "(" и вот таких ")" скобочек? Очевидно, там 3 ")" подряд, а не две :tease:

5)я взял среднее время ответа 8 часов и стандартное отклонение 1.5 часа;

Откуда?

графики плотности и функции логнормального распределения меня в общем устроили; вероятность получить ответ за 6 часов равна 0.24, а за 12 часов - 0.84.

Chi^2/d.o.f. = ?

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

В формуле

dw/dt = N * ( 1 - exp(-t/T_отв)) * exp( - (t - T_отв*(1-exp(-t/T_отв))/Т_ув )

неверно расставлены скобки. Почему

Очевидно, там 3 ")" подряд, а не две

???Далее.Мы обсуждаем абсолютно непрерывную случайную величину Х, равную времени от задания вопроса до получения первого ответа. Она принимает любое значение от 0 до Т_ух, так как

dw/dt = 0, при t >= T_ух

Значит, вероятность получить ответ при t>T_ух строго равна 0. С другой стороны, мы допускаем, что человек не получит ответ вообще. Из этого вытекает, что обсуждать так заданную случайную величину не имеет смысла! (Случайная величина всегда принимает какое-нибудь конечное значение.)Значения 8 часов и 1.5 часа я просто подобрал, пробуя разные графики.И что означаетChi^2/d.o.f. = ??Хи-квадрат делить на степени свободы равно?"заставить консультанта отвечать на все вопросы" - в модели, а не в жизни!

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Чего-й то веселье затянулось

В формуле

неверно расставлены скобки. Почему

Очевидно, там 3 ")" подряд, а не две

???

Очевидно потому, что одна скобка пропущена :cray:

Мы обсуждаем абсолютно непрерывную случайную величину Х, равную времени от задания вопроса до получения первого ответа. Она принимает любое значение от 0 до Т_ух

От 0 до бесконечности на самом деле :blink: А фитировать измеренное распределение можем c упрощением dw/dt=0 при t > некоторого Т_ух, которое тоже подгоняется.

С другой стороны, мы допускаем, что человек не получит ответ вообще.

То есть сообщение попадает в крайний правый "бин" (t > некоторого Т).

Из этого вытекает, что обсуждать так заданную случайную величину не имеет смысла!

(Случайная величина всегда принимает какое-нибудь конечное значение.)

См. выше :( Не отвеченное _до сих пор_ сообщение и отвеченные при t>T попадают в самый правый бин, поэтому неотличимы при подгонке.

Чтобы сравнить интеграл dw/dt по любому бину с числом сообщений в этом бине, на что надо умножить интеграл dw/dt? :flood:

Значения 8 часов и 1.5 часа я просто подобрал, пробуя разные графики.

Хи-квадрат делить на степени свободы равно?

чему?

"заставить консультанта отвечать на все вопросы" - в модели, а не в жизни!

Зачем рассматривать модель, не имеющую отношения к жизни?

На форуме достаточно сообщений, чтобы увидеть T_ух.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Во-первых, есть такие консультанты, которые, видя, что они не ответили ни на один вопрос с первой страницы, смотрят и на вторую (без принуждения и т.п.). Я, например.Во-вторых, "практика - критерий истины". Соберите статистику!

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

To pravdins:Не смешно!

Соберите статистику!

:o Соберите сами, любопытный Вы наш! :blink:

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Ладно, получите на пару какие-то результаты, пишите. Оревуар!

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Математические замечания:1) строим не распределение, а гистограмму или полигон2) если строить именно распределение, оно будет дискретным, а знамомые мне ДСВ (дискретные случайные величины), наверное, плохо описали бы ситуацию3) интересен наиболее близкий тип распределения соответствующей абсолютно непрерывной СВ (хи-квадрат? логнормальное?)

Это интересно, но сбор статистики выльется в кучу трафика. Если кому-то действительно нужны результаты статрасчетов, можно прислать мне по почте архив rar/zip с таблицей excel и вопросами.

Запускать программку можно прямо на серверной машине, даже через морду форума - это чтобы не заморачиваться с запросами к базе.man wget, man bash, man grep, man sed, etc. etc. Тоска то какая зеленая :blink: Изваяете скриптик, можно попросить координатора прогнать его прямо на сервере.

Ладно, получите на пару какие-то результаты, пишите. Оревуар!

Т.е. интерес к статистике резко пропал? А так хорошо начали.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

год назад форум был поактивнее :)

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

У всех есть спады и подъемы...

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

man wget, man bash, man grep, man sed, etc. etc. Изваяете скриптик, можно попросить координатора прогнать его прямо на сервере.

Ладно, раскрою свои карты: я в таких скриптиках "не Копенгаген". Ваяю только на всяких Бейсиках, Паскалях и "Сях"++. Ну и SQL.А интерес к статистике не пропал. Просто люблю приходить на готовенькие исходные данные.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Ой, я тож на готовенькое люблю приходить... И на готовенький обед, и на готовенькую уборку, а еще на готовенькую зарплату, особливо когда с премией. Жалко только, что за уборку платить приходится, а за зарплату работать. pravdins, Вы не могли бы мне скриптик написать, чтобы каждый день было 5 число следующего месяца и уборщица денег не брала, а? :):flood:

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Создайте аккаунт или войдите для комментирования

Вы должны быть пользователем, чтобы оставить комментарий

Создать аккаунт

Зарегистрируйтесь для получения аккаунта. Это просто!


Зарегистрировать аккаунт

Войти

Уже зарегистрированы? Войдите здесь.


Войти сейчас