
IMDB или The Internet Movie Database был создан 17 октября 1990 года в Англии и на данный момент является одной из самых крупных платформ содержащих данные о кинематографе, которую могут свободно читать, использовать и редактировать пользователи со всего мира. Потому обладая базой данных, в которой собрано 1000 фильмов которые считаются лучшими по мнению пользователей веб-сайта (IMDB) интересно узнать, что стало причиной их признания лучшими во всём мире. Основных критериев три: хронометраж (сколько), год выхода (когда) и жанр (какой).
Выше предложенные мерила (критерии) отбора выбраны из следующих соображений:
1 — Хронометраж фильма играет важную роль в восприятии зрителем. Длительность влияет на темп нарратива и общее восприятие. Краткие фильмы могут быть более динамичными и легкими для восприятия, в то время как длинные часто позволяют глубже развить сюжет и персонажей. Сравнение хронометража лучших фильмов помогает понять, какие форматы наиболее успешны в создании эмоциональной связи с аудиторией.
2 — Год выхода имеет значение, так как он отражает культурные и социальные контексты времени, когда фильм был создан. Технологический прогресс, изменения в обществе, а также тренды в киноиндустрии могут значительно повлиять на успех фильмов. Анализ фильмов по годам позволяет увидеть эволюцию киноискусства и предпочтений зрителей.
3 — Жанр фильма определяет его характер и тональность, а также целевую аудиторию. Изучение жанров среди 1000 лучших фильмов показывает, какие из них наиболее популярны и почему. Это позволяет исследовать, как жанровая принадлежность влияет на восприятие фильмов и их успех.
Таким образом, сочетание данных по хронометражу, году выхода и жанру позволяет получить целостное представление о лучших фильмах по версии IMDB, выявляя объективные тенденции и предпочтения зрителей в кино.
Первостепенно было решено собрать информацию о списке и взять во внимание общие факты. Например определим количество фильмов в том или ином жанре и получим следующую статистику, фильмов жанре драма 499, приключенческих 162, комедий 161, криминальных 142, экшн-фильмов 140, триллеров 99, биографических 88, романтических 88, мистика 70, анимационных 63, сай фай 56, фэнтези 55, семейных 43, исторических 37, военных 29, музыкальных 27, ужасов 18, спортивных 17, вестернов 16, мюзиклов 11 и нуар 6.

plt.figure (figsize=(10, 6)) genre_counts.head (10).plot (kind='bar', color='orange') plt.title ('Top 10 Genres by Movie Count') plt.xlabel ('Genre') plt.ylabel ('Number of Movies') plt.show ()
Оптимальная продолжительность фильма в примерно 100-125 минут. Это можно объяснить следующими положительными моментами:
• 125 минут достаточно для полноценного раскрытия сюжета без излишней затянутости. • Такой хронометр позволяет удерживать внимание зрителей, обеспечивая динамичное развитие событий. • Статистически фильмы с такой длительностью чаще получают высокие рейтинги, так как они балансируют между глубиной повествования и ритмом.
Важно отметить, что данная статистика носит агрегированный характер. Оптимальная длительность может варьироваться в зависимости от жанра, сценарной задумки и целевой аудитории. Однако общий вывод таков — фильмы длительностью около 125 минут имеют тенденцию получать лучшие оценки за счёт оптимального баланса между временем и качеством подачи материала.
plt.figure (figsize=(10, 6)) sns.scatterplot (x='Runtime', y='IMDB_Rating', data=df, alpha=0.6, color='green') plt.title ('Runtime vs. IMDb Rating') plt.xlabel ('Runtime (minutes)') plt.ylabel ('IMDb Rating') plt.show ()
Распределение оценок показывает, сколько фильмов попадает в ту или иную категорию качества. Небольшое число фильмов с очень высокими оценками указывает на исключительную успешность в этой группе. Большая группа фильмов с оценками чуть ниже максимума свидетельствует о стабильном, но менее выдающемся уровне успеха. Сравнивая количество фильмов в каждой категории, можно определить, где сосредоточены лидеры и отстающие по качеству.
plt.figure (figsize=(10, 6)) sns.histplot (df['IMDB_Rating'], bins=30, kde=True, color='blue') plt.title ('Distribution of IMDb Ratings') plt.xlabel ('IMDb Rating') plt.ylabel ('Frequency') plt.show ()
Годовая прибыль в год выпуска показывает первоначальный интерес и маркетинговый успех фильма. Высокие доходы в первом году свидетельствуют о сильном привлечении аудитории. Прибыль, полученная в последующие годы, указывает на долговременную привлекательность и культурное влияние фильма. Анализ этих показателей вместе позволяет оценить как краткосрочный, так и устойчивый успех фильма.
gross_by_year = df.groupby ('Released_Year')['Gross'].sum ()
plt.figure (figsize=(12, 6)) gross_by_year.plot (kind='line', color='purple') plt.title ('Gross Earnings by Year') plt.xlabel ('Year') plt.ylabel ('Total Gross Earnings') plt.show ()
Вывод:
Анализ 1000 лучших фильмов по версии IMDB демонстрирует, что признание киноленты во многом определяется сочетанием трех ключевых факторов.
• Хронометраж выступает важным элементом, влияющим на динамику повествования и эмоциональную связь с аудиторией. Оптимальная длительность (около 125 минут) зачастую обеспечивает баланс между насыщенностью сюжета и сохранением внимания зрителя.
• Год выхода фильма отражает не только технологический уровень производства, но и культурные, социальные и исторические тенденции своего времени. Это позволяет понять, как эволюция киноискусства и изменения в обществе влияют на предпочтения зрителей и, соответственно, на успех фильма.
• Жанр задаёт характер повествования и целевую аудиторию. Популярность определённых жанров среди лучших фильмов подтверждает, что именно выбранная форма подачи материала часто становится решающим фактором в создании кинокартины, способной завоевать признание на мировом уровне.
Таким образом, сочетание оптимального хронометража, соответствия временным трендам и правильно подобранного жанра является залогом успеха и признания фильма как одного из лучших в мировом кинематографе.
Описание применения генеративной модели
Для своей работы я использовал нейросеть Leonardo для генерации обложки
promt: Take a realistic camera photo against the background of stretched films
ссылка на модель: https://leonardo.ai/
Ссылка на датасет и код: https://drive.google.com/drive/folders/1aQWFw6xOZQl5gbUszXRJqS4kXnNsHBH3?usp=sharing