Как создать интерактивную аналитическую панель с помощью функций PyGWalker для глубокого изучения данных

В этом руководстве мы рассмотрим расширенные возможности PyGWalker — мощного инструмента для визуального анализа данных, который легко интегрируется с pandas.

Шаг 1: Генерация реалистичного набора данных для электронной коммерции

Мы начинаем с создания реалистичного набора данных для электронной коммерции, обогащённого временными, демографическими и маркетинговыми характеристиками, чтобы имитировать реальные бизнес-данные.

«`python
import pandas as pd
import numpy as np
import pygwalker as pyg
from datetime import datetime, timedelta

def generateadvanceddataset():
np.random.seed(42)
start_date = datetime(2022, 1, 1)
dates = [start_date + timedelta(days=x) for x in range(730)]
categories = [‘Electronics’, ‘Clothing’, ‘Home & Garden’, ‘Sports’, ‘Books’]
# … (код для генерации данных)
return df

df = generateadvanceddataset()
«`

Шаг 2: Подготовка аналитических представлений

Затем мы подготавливаем несколько аналитических представлений, включая ежедневные продажи, производительность по категориям и сводки по сегментам клиентов.

«`python
daily_sales = df.groupby(‘Date’).agg({
‘Revenue’: ‘sum’, ‘Quantity’: ‘sum’, ‘Customer_Satisfaction’: ‘mean’
}).reset_index()

category_analysis = df.groupby(‘Category’).agg({
‘Revenue’: [‘sum’, ‘mean’], ‘Quantity’: ‘sum’, ‘CustomerSatisfaction’: ‘mean’, ‘ProfitMargin’: ‘sum’
}).reset_index()
«`

Шаг 3: Визуализация данных с помощью PyGWalker

Наконец, мы используем PyGWalker для интерактивного изучения закономерностей, корреляций и тенденций с помощью интуитивно понятных визуализаций методом перетаскивания.

«`python
print(«\n Launching PyGWalker Interactive Interface…»)
walker = pyg.walk(
df,
spec=»./pygwalker_config.json»,
usekernelcalc=True,
theme_key=’g2′
)
«`

Baidu выпускает ERNIE-4.5-VL-28B-A3B-Thinking: компактная модель мультимодального рассуждения

Baidu добавила новую модель в семейство ERNIE-4.5 с открытым исходным кодом. ERNIE-4.5-VL-28B-A3B-Thinking — это модель визуального языка, ориентированная на понимание документов, диаграмм и видео при небольшом бюджете активных параметров.

Архитектура и настройка обучения

Модель построена на архитектуре ERNIE-4.5-VL-28B-A3B Mixture of Experts. Она использует гетерогенный мультимодальный дизайн MoE с общими параметрами для текста и изображений плюс модально-специфичные эксперты.

Ключевые возможности

Модель Baidu позиционируется как лёгкий мультимодальный механизм рассуждений, который может активировать только 3 миллиарда параметров, приближаясь при этом к поведению более крупных флагманских систем на внутренних тестах.

Оптимизация затрат и задержек в приложениях RAG с помощью семантического кэширования LLM

Семантическое кэширование в приложениях LLM оптимизирует производительность, сохраняя и повторно используя ответы на основе семантического сходства, а не точных текстовых совпадений.

Как работает семантическое кэширование

Каждый входящий запрос преобразуется в векторное вложение, представляющее его семантическое содержание. Система выполняет поиск сходства, часто используя методы Approximate Nearest Neighbor (ANN), чтобы сравнить это вложение с уже сохранёнными в кэше.

Maya1: новая модель открытого текста для выразительной речи с помощью текста на одном GPU

Maya1 — это модель текста в речь с 3 миллиардами параметров, которая генерирует аудио с частотой 24 кГц и поддерживает потоковую передачу в реальном времени на одном GPU.

Что делает Maya1?

Maya1 — это современная модель речи для генерации выразительного голоса. Она создана для передачи реальных человеческих эмоций и точного голосового дизайна на основе текстовых входных данных.

Архитектура и кодек SNAC

Maya1 — это декодер с 3 миллиардами параметров с бэкендом в стиле Llama. Вместо прогнозирования необработанных сигналов модель генерирует токены из нейронного аудиокодека SNAC.

1. Какие возможности предоставляет инструмент PyGWalker для анализа данных?

Инструмент PyGWalker предоставляет возможности для визуального анализа данных, включая интерактивное изучение закономерностей, корреляций и тенденций с помощью интуитивно понятных визуализаций методом перетаскивания.

2. Какие шаги необходимо выполнить для создания интерактивной аналитической панели с помощью PyGWalker?

Для создания интерактивной аналитической панели с помощью PyGWalker необходимо выполнить следующие шаги:
* Генерация реалистичного набора данных для электронной коммерции.
* Подготовка аналитических представлений, включая ежедневные продажи, производительность по категориям и сводки по сегментам клиентов.
* Визуализация данных с помощью PyGWalker.

3. Какие типы данных можно анализировать с помощью PyGWalker?

С помощью PyGWalker можно анализировать данные, связанные с электронной коммерцией, включая временные, демографические и маркетинговые характеристики.

4. Какие методы используются для визуализации данных в PyGWalker?

В PyGWalker используются методы перетаскивания для визуализации данных, что позволяет интуитивно изучать закономерности, корреляции и тенденции.

5. Какие преимущества предоставляет использование PyGWalker для анализа данных?

Использование PyGWalker для анализа данных предоставляет следующие преимущества:
* Интуитивно понятные визуализации, которые позволяют быстро и эффективно изучать данные.
* Возможность интерактивного изучения закономерностей, корреляций и тенденций.
* Лёгкая интеграция с pandas, что упрощает работу с данными.

Источник