您的位置:科河生活网 > 杂谈 > >正文

​模特私拍圈子混乱不堪?小君做了个数据分析

摘要模特私拍圈子混乱不堪?小君做了个数据分析 导读:不少人都在说模特私拍圈子非常的混乱不堪,小君当即决定通过技术手段对这个圈子进行一次大数据分析,结果,我有了一个惊人的...

模特私拍圈子混乱不堪?小君做了个数据分析

导读:不少人都在说模特私拍圈子非常的混乱不堪,小君当即决定通过技术手段对这个圈子进行一次大数据分析,结果,我有了一个惊人的发现!接下来让小君慢慢给你讲!耐心看哟。


小君在日常在互联网浏览学习的时候,无意间看到一位刚刚走出大学校园的女神小姐姐在某网站发布了一个寻求帮助的帖子,大致的内容就是说现在刚毕业的大学生找工作不是特别的好找,平时她对基本的物质要求还是有点高,衣服、化妆品等日常开销也是一笔不小的数目,所以一般的小公司不太想去。


偶然之间通过朋友的介绍让她去一家模特私拍工作室当模特拍摄私房照片,因为身材和相貌都较为出众,给的待遇也相当不错,有点动心,然后就去了,最开始的时候只拍摄腿和脚,给的价格是5000块钱一套,两个小时拍摄完成,就接连做了10单,后来就怂恿她继续拍摄其他题材的照片,价格也翻了一番。


其中她自己爆料说,第一拍摄场地极其不正规,很多都是在酒店等没有拍摄条件的地方拍摄,第二拍摄人不专业,大部分都是工作室老板亲自拍摄并非专业摄影师,用的相机也比较落后,没有专业补光等等,第三,在拍摄过程中使用一些乱七八糟的道具(具体小君就不说了),而且会有动手动脚的小动作让她不胜其烦。


根据她的爆料让我意识到这类的工作室背后一定有秘密,决定对它好好地研究一番。

相信看过小君之前视频和文章的都知道,我们可以通过照片获取拍摄的设备、时间、GPS定位也就是拍摄地点等信息,如果不太清楚的小伙伴不要着急,我会在文章的最下方放上获取图片信息的代码,假如我从这些私拍网站通过技术手段爬取下载一些照片,然后对其进行大数据分析,看看会有什么结果?说做就做。


我抓紧找了几个名气较大的网站,因为大部分都需要账号密码并且开通VIP,所以我想办法弄到了几个(不许找我要),然后连夜写好了爬虫代码进行下载,看见照片一张一张飞快地进入到我的硬盘当中,心里竟产生了一丢丢的小窃喜,趁着时间还不是很晚,抓紧休息一下,等醒来的时候,竟然发现硬盘满了,大体算了一下竟然有5万多张。


如果拿着5万张照片做大数据分析的话完全够了,我通过多线程开始对这些照片进行GPS地理位置进行分析,这里面用到了python的numpy、数据分析panda、绘图matplotlib和数据可视化pyecharts,有兴趣的小伙伴可以自己安装以上模块进行分析测试,小君整整分析了两天,电脑都快要冒烟了,现在我们来看看结果,通过对地理位置的分析基本上拍摄的地点都是一些小区和酒店,与那位女神小姐姐描述一致。


然后对省份的比例进行分析,看看排名靠前的有哪些?


然后对城市排名做了个分析。


通过上面的分析图片大家发现了哪些小秘密呢?欢迎评论区告诉小君。

代码区:

# -*- coding: utf-8 -*-
# @Author: 极客小君
# @Date : 2021/10/5 12:43
 
import requests
import exifread
 
 
class GetPhotoInfo:
def __init__(self, photo):
self.photo = photo
# 百度地图ak,通过百度地图可以把GPS数字定位到地图中获取详细的地理位置
self.ak = '3iVKI77ap5Tb2M2FIGS1gvEtcSzD3yWZ'
self.location = self.get_photo_info()
 
def get_photo_info(self, ):
with open(self.photo, 'rb') as f:
tags = exifread.process_file(f)
try:
# 打印照片其中一些信息
print('拍摄时间:', tags['EXIF DateTimeOriginal'])
print('照相机制造商:', tags['Image Make'])
print('照相机型号:', tags['Image Model'])
print('照片尺寸:', tags['EXIF ExifImageWidth'], tags['EXIF ExifImageLength'])
# 拿到的是度分秒的经纬度,需要转化为十进制的经纬度
# 转换公式为度 + 分 / 60 + 秒 / 3600
# 纬度
lat_ref = tags["GPS GPSLatitudeRef"].printable
lat = tags["GPS GPSLatitude"].printable[1:-1].replace(" ", "").replace("/", ",").split(",")
lat = float(lat[0]) + float(lat[1]) / 60 + float(lat[2]) / float(lat[3]) / 3600
if lat_ref != "N":
lat = lat * (-1)
# 经度
lon_ref = tags["GPS GPSLongitudeRef"].printable
lon = tags["GPS GPSLongitude"].printable[1:-1].replace(" ", "").replace("/", ",").split(",")
lon = float(lon[0]) + float(lon[1]) / 60 + float(lon[2]) / float(lon[3]) / 3600
if lon_ref != "E":
lon = lon * (-1)
except KeyError:
return "ERROR:请确保照片包含经纬度等EXIF信息。"
else:
print("经纬度:", lat, lon)
return lat, lon
 
def get_location(self):
url = 'https://c.quk.cc/3/z14/jzkuff4twjt' \
  '&coordtype=wgs84ll&location={},{}'.format(self.ak, *self.location)
response = requests.get(url).json()
status = response['status']
if status == 0:
address = response['result']['formatted_address']
print('详细地址:', address)
else:
print('baidu_map error')
 
 
if __name__ == '__main__':
Main = GetPhotoInfo('这个地方填写图片的物理路径,如果多图片可以for循环')
Main.get_location()

结语:看来这类行业属于灰色产业链,在平时拍摄时都是尽可能地隐匿起来。通过这类网站上面的信息可以看出它后面有着一整条完整的产业链。在这里提醒一下那些小姐姐们,入行需谨慎。

感谢阅读全文,如果喜欢小君的小伙伴欢迎关注我的账号!记得点赞转发哟~


标签:

推荐阅读