Сохранен 7
https://2ch.hk/b/res/319110300.html
24 декабря 2023 г. Архивач восстановлен после серьёзной аварии. К сожалению, значительная часть сохранённых изображений и видео была потеряна. Подробности случившегося. Мы призываем всех неравнодушных помочь нам с восстановлением утраченного контента!

Порноактрисы и вебкамщицы - dataset (более 3000 изображений) Дата сбора: 19.04.2025 Содержимое: из

 Аноним 19/04/25 Суб 23:43:44 #1 №319110300 
1637215084994.png
Порноактрисы и вебкамщицы - dataset (более 3000 изображений)

Дата сбора: 19.04.2025

Содержимое: изображения лиц в формате jpg, имя файла - полное имя порнозвезды, точки и пробелы замены символом подчеркивания

Источник: https://pornstarbyface.com/Girls

Инструмент: кастомный парсер в виде юзерскрипта https://ghostbin.cloud/g845x

Количество: 3175, возможны дубли, несколько изображений повреждены.

Имя архива с датасетом: pstars_20250419.zip

Cсылка на архив: https://dropmefiles.com/f9Msi (срок хранения - 04.05.2025).

Размер архива: 171814920 байт (163 Мб)

Контрольные суммы архива:
CRC32: D45CEA1B
CRC64: 46EA7F70EBC36FE3
SHA256: 2581f20ce7b5184a98a9fbb03d09a17163c54e2760cfcd42bc1ac4ea29d03715
SHA1: e7167a9859108abdc423045b8885b5f2c2c39265
BLAKE2sp: b0fcf3b802fe1421e744eb3833c88a5ca76085b06cf7d418551d467340ff99c1
MD5: 2c54561311bbf7100fe1b01d2cc52056
XXH64: A5433E553E3954B3
SHA384: 3eca41bab26c2950c6e0b8df70910f2fc4ca71a6319e015302fea79b7487a774bea5ead4b8b9ec54ab22248496e09255
SHA512: 90753bca264f033cae6e127741760f75cd4046c8f5b90d07efb5a62cfd9a04575772abee6d5179587fac6c245021d9276dd646d830bda64d3f5984e6e47311a8
SHA3-256: d83a2e862047475643ea08d57833350f9ba8bdef738ba16115f5c2529f2093ec
Аноним 19/04/25 Суб 23:45:10 #2 №319110345 
Датасет, который вы описали, содержит изображения порноактрис и вебкам-моделей, собранные с платформы pornstarbyface.com. Вот ключевые моменты, которые стоит учесть при работе с ним:

1. Структура данных:
- Формат файлов: `jpg` с именами, заменяющими пробелы и точки на подчеркивания (например, `Anna_Kuznetsova.jpg`).
- Размер архива: 163 Мб, содержит 3175 изображений, но возможны дубликаты и поврежденные файлы , .

2. Источники и этика:
- Данные собраны с сайта, специализирующегося на идентификации порноактрис по лицам, что может вызывать вопросы конфиденциальности и согласия , .
- Вебкам-модели часто пересекаются с индустрией порнографии, но их статус и условия работы могут различаться , , .

3. Технические аспекты:
- Для проверки целостности используйте контрольные суммы (например, SHA256: `2581f20ce7b5184a98a9fbb03d09a17163c54e2760cfcd42bc1ac4ea29d03715`).
- Учитывайте необходимость удаления дубликатов и фильтрации поврежденных изображений.

4. Социальный контекст:
- Работа с такими данными требует осторожности из-за стигматизации профессий , . Например, вебкам-модели часто сталкиваются с осуждением, несмотря на отсутствие незаконной деятельности .

5. Потенциальное применение:
- Может использоваться для исследований в области компьютерного зрения (например, распознавание лиц), но с учетом этических норм .
- Важно проверить, не нарушает ли использование датасета законы о приватности (например, GDPR).

Ссылка на архив действительна до 4 мая 2025 года. Если вы планируете публиковать результаты анализа, убедитесь, что это не нарушает права лиц, изображенных в датасете , .
Аноним 19/04/25 Суб 23:47:24 #3 №319110425 
Для создания программы, находящей похожие лица из датасета порноактрис и вебкам-моделей, можно использовать следующий подход:

---

### 1. Инструменты и библиотеки
- OpenCV для обнаружения лиц на изображениях .
- Face Recognition (на основе dlib) или DeepFace для извлечения эмбеддингов лиц , .
- PyTorch/TensorFlow для кастомных моделей (если требуется дообучение).
- FAISS (Facebook AI Similarity Search) для быстрого поиска похожих векторов в датасете.

---

### 2. Этапы реализации
#### a. Предобработка датасета
- Извлеките эмбеддинги (числовые представления) для всех лиц из архива `pstars_20250419.zip`:
```python
import face_recognition
import numpy as np

embeddings = []
for image_path in dataset_images:
image = face_recognition.load_image_file(image_path)
face_encodings = face_recognition.face_encodings(image)
if face_encodings:
embeddings.append(face_encodings[0]) # Берем первое обнаруженное лицо
```
Источник: , .

#### b. Обработка входного изображения
- Загрузите фото пользователя, найдите лицо и извлеките его эмбеддинг:
```python
input_image = face_recognition.load_image_file("input.jpg")
input_encoding = face_recognition.face_encodings(input_image)[0]
```

#### c. Поиск похожих лиц
- Используйте косинусное сходство или евклидово расстояние для сравнения эмбеддингов:
```python
from sklearn.metrics.pairwise import cosine_similarity

similarities = []
for idx, emb in enumerate(embeddings):
similarity = cosine_similarity([input_encoding], [emb])[0][0]
similarities.append((idx, similarity))

# Топ-5 совпадений
top_matches = sorted(similarities, key=lambda x: x[1], reverse=True)[:5]
```
Источник: , .

#### d. Вывод результатов
- Покажите имена и изображения из датасета, соответствующие топ-результатам.

---

### 3. Оптимизация и этика
- Дедупликация: Удалите повторяющиеся изображения из датасета перед использованием .
- Обработка ошибок: Проверяйте поврежденные файлы и отсутствие лиц на фото .
- Этика: Убедитесь, что использование датасета не нарушает законы о приватности (например, GDPR) , .

---

### 4. Альтернативные решения
- API-сервисы:
- Azure Face API , для распознавания и сравнения лиц.
- Betaface — готовый инструмент с GUI для тестирования.
- Готовые программы: Tonfotos или Picasa для ручного поиска.

---

### Пример кода (упрощенный)
```python
import face_recognition
import numpy as np
from glob import glob

# Загрузка датасета
dataset = {}
for path in glob("dataset/*.jpg"):
name = path.split("/")[-1].split(".")[0]
image = face_recognition.load_image_file(path)
encoding = face_recognition.face_encodings(image)
if encoding:
dataset[name] = encoding[0]

# Поиск совпадений
input_image = face_recognition.load_image_file("input.jpg")
input_encoding = face_recognition.face_encodings(input_image)[0]

results = []
for name, enc in dataset.items():
distance = np.linalg.norm(input_encoding - enc)
results.append((name, distance))

# Вывод топ-3
for name, _ in sorted(results, key=lambda x: x[1])[:3]:
print(f"Похожа: {name.replace('_', ' ')}")
```

---

### Источники:
- , , — методы распознавания.
- , — сравнение эмбеддингов.
- — обработка дубликатов и этика.
sage[mailto:sage] Аноним 19/04/25 Суб 23:47:45 #4 №319110441 
❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗ВИРУС❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗ВИРУС❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗ВИРУС❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗ВИРУС❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗❗
Аноним 19/04/25 Суб 23:48:47 #5 №319110492 
Постоянный тред
https://2ch.hk/e/res/803056.html
Аноним 19/04/25 Суб 23:52:51 #6 №319110654 
Как создавался парсер https://chat.qwen.ai/s/58928793-c186-4a0c-aa87-a654ce529759

Идеи по работе с датасетом, например поиск похожих порнозвёзд по фото https://chat.qwen.ai/s/651c711f-66ed-4fb3-ae07-0eefce36a232
Аноним 20/04/25 Вск 00:22:36 #7 №319111858 
Аналогичные сайты, содержащие информацию об порноактрисах

https://actress-base.ru/
https://www.iafd.com/

Список https://toppornguide.com/ru/pornstar-databases/
comments powered by Disqus

Отзывы и предложения