본문 바로가기

Data Analysis33

[Python] 가상환경 설정 Python을 사용할 때 가상환경에서 구동할 필요가 있다. Python에서 가상환경을 설치하는 주된 이유는 프로젝트별 독립적인 환경을 유지하고 패키지 관리에 편리하기 때문이다.  1. 프로젝트 간 패키지 충돌 방지각 프로젝트는 서로 다른 패키지와 버전을 요구할 수 있다. 예를 들어, 하나의 프로젝트는 Django 3.x 버전을 사용하고, 다른 프로젝트는 Django 4.x 버전을 사용할 수 있다.만약 모든 프로젝트가 동일한 전역 환경(global environment)에서 실행된다면, 서로 다른 패키지 버전이 충돌하여 에러가 발생할 수 있다.가상환경을 사용하면, 각 프로젝트마다 별도의 패키지 버전을 유지할 수 있어 충돌을 방지할 수 있다.2. 프로젝트 이식성 향상가상환경은 requirements.txt .. 2024. 10. 8.
[ChatGPT] GPT-4를 사용한 다중회귀분석 이 블로그에서 예시로 진행했던 회귀분석을 GPT-4를 사용해서 진행해 봤다. 과연 어떻게 분석해줄지 너무 궁금했는데, 과정과 결과가 너무나 놀라웠다.. 이제 통계에 대한 아주 간단한 지식만 있으면 누구나 분석을 진행할 수 있는 시대가 온 것이다.. (논문 쓰며 개고생했던 지난 날이 왜 갑자기 떠오르는지..) ㅜㅜ 그런데, 이게 과연 어떤 영향을 줄지 누구도 예측할 수 없겠지만.. 여튼 중요한 건 어줍짢은 실력으로 나대지 말고 계속해서 발전하는 AI를 뒤쫓아가야 한다는 것! 이것저것 새로운 것을 두려워하지 말고 열심히 배우고 공부하고 학습하고 적용해봐야겠다. 지금부터는 회귀분석을 요청했을 때 GPT-4가 어떤 식으로 작동하는지 보여줄 것이다. 보시는 분들 모두 어떻게 질문하는 것이 효과적일지 한번 생각해보.. 2023. 11. 16.
[ChatGPT] ChatGPT의 개요 이번 포스팅에서는 요즘 핫한, 앞으로도 계속 핫할 예정인 ChatGPT에 대해 알아보겠습니다. 최근에 ChatGPT가 대규모 업그레이드를 진행하면서 다시 한 번 굉장한 업그레이드를 발표했는데요, 특히, 1. GPT-4 Turbo를 발표하면서 한 번에 300페이지 이상의 텍스트를 입력 할 수 있게 해주었습니다. 그리고 GPT-4 Turbo의 지식은 2023년 4월까지로 최신 데이터를 탑재했죠. 2. 저는 두 번째 계획을 들으며 더 놀라웠는데요, 다음 세대 계획으로 GPTs를 발표하면서 코딩 없이 나만의 챗봇을 만들 수 있는 환경을 구축했습니다. 나만의 챗봇을 만들어서 GPT 스토어에 올려 수익화를 가능하게 했습니다. 발전 속도가 너무나도 빨라서 계속 흥미진진한데요, 오늘은 우선 ChatGPT의 히스토리와 .. 2023. 11. 16.
[Spatial analysis] 공간정보의 이해 오늘은 공간정보의 기본 개념에 대해 살펴보도록 하겠습니다. 공간정보는 영어로는 Geographic Information System라고 하며 흔히 줄여서 GIS라고 부릅니다. 공간정보의 약80%는 위치정보를 가지고 있습니다. 개념을 간단히 말하면 위치정보와 그에 해당하는 속성정보를 통칭해서 공간정보라고 할 수 있겠네요. 구분하여 아래와 같이 정의할 수 있을 것 같습니다. 도형정보정보와 속성정보를 모두 가지는 정보 도형정보 : 대상이 있는 위치를 말함 (측량, GPS, 항공사진, 위성영상 등으로 취득) 속성정보 : 대상이 가지고 있는 특성을 말함 (통계, 관측 데이터 등으로 취득) 위치의 개념 위치는 지구의 모형에 따라 정의됩니다. 우리가 흔히 알고 있듯이 지구는 타원형의 모양을 가지고 있죠. 위치정보는 .. 2023. 10. 27.
[Spatial Analysis] 공간 데이터 분석은? 안녕하세요. 이번에는 공간 분석을 공부해보려고 합니다. 여기에서는 먼저 공간 데이터 과학이 정확히 무엇인지, 그것을 사용하기 위해 알아야 할 기술은 무엇인지, 현재 직업에서 어떻게 사용할 수 있는지 또는 공간 데이터 과학 기술을 사용할 수있는 다른 방법과 정확히 무엇을 배워야하고 어디서 배워야하는지 살펴보도록 하겠습니다. 우리가 집중할 두 가지 중요한 개념이 있습니다. 첫째, 공간 데이터 과학은 데이터 과학의 하위 집합으로 공간 데이터의 고유한 특성에 초점을 맞추어 단순히 어떤 일이 발생하는 위치를 살펴보는 것을 넘어 왜 그런 일이 발생하는지 이해하는 것입니다. 둘째, 공간 데이터 과학은 위치 거리와 공간 상호 작용을 데이터의 핵심으로 취급하고 전문적인 학습 내용을 시각화하고 공간 사용 사례에 적용하는 .. 2023. 10. 12.
[통계] 구조방정식(2) 측정모델의 신뢰도와 타당도 • 신뢰도와 타당도 - 신뢰도란 반복된 측정에서 어느 정도 동일한 결과를 얻는 가의 의미 - 타당도: 연구자가 관찰하려고 하는 것을 어느 정도 제대로 관찰 했는가? 1) 신뢰도: 크론바흐 알파계수, 복합신뢰도, 평균분산추출을 이용해 평가 - 크론바흐 알파계수 > 0.7 - 복합신뢰도 > 0.7 (1)Cronbach’s alpha: 각 잠재변수의 인자 부하량의 합계를 제곱한 수치와 측정변수의 오차분산을 합계한 것. 높을수록 일관성이 높다는 것을 의미. CR>0.7 2) 타당도 (1) 수렴타당도(convergent validity) - 요인적재값이 통계적으로 유의해야 함: AVE > 0.5 - 측정변수는 잠재변수의 공통분산에 상당히 많은 비중(높은 부하량)을 보여야 한다는 것 a... 2023. 2. 7.