2022년 8월 17일 수요일

Pandas 인덱스

1. 직접 배정해 주는 방법

직접 배정해주려면 data와 갯수가 맞아야 합니다. 다음과 같은 메소드를 씁니다.

 

DataFrame.index= list

DataFrame.columns = list

 

list로 설정된 값이 인덱스로 들어가게 됩니다.

import numpy as np

import pandas as pd

ddf = pd.Dataframe(np.arange(0,16).reshape(4,4))

ddf


ddf.index = ['r0','r1','r2','r3']

ddf.columns = ['c0','c1','c2','c3']

ddf


2. set_index

set_index로 원래 있던 columns을 index로 불러들이는 방법입니다.

 

DataFrame.set_index(keys, drop=True, append=False, inplace=False, verify_integrity=False)

 

keys 에는 인덱스로 사용하려는 열의 레이블을 입력받습니다.

멀티 인덱스를 하려면 리스트형태로 값을 넣어주시면 됩니다.

drop은 인덱스로 쓸 열을 데이터 내에서 지울것인지 여부를 결정합니다.

append는 기존의 쓰던 인덱스를 삭제할지 여부를 결정합니다.

inplace는 원본 객체를 변경할지 여부를 결정합니다.

verify_integrity는 인덱스 중복여부를 체크하는 것인데 True로 하면 체크하는 시간 때문에 성능이 떨어집니다.


3. reset_index

설정했던 인덱스를 초기화 해보겠습니다.

 

DataFrame.reset_index(level=None, drop=False, inplace=False, col_level=0, col_fill='')

 

drop과 inplace만 주로 쓰입니다.

level 은 인덱스에서 주어진 단계를 제거합니다. 기본값은 모든 단계를 제거합니다.

col_level은 멀티인덱스일 경우 어떤 것으로 삽입할것인지 설정합니다. 기본값이 0이어서 첫번째 것이 삽입됩니다.

col_fill은 멀티인덱스일 경우 어떻게 다른 단계의 이름을 붙일 것인지 설정합니다. 기본값은 '' 라서 안 붙여집니다. 

'None'으로 하면 인덱스 이름이 반복됩니다.


만약 데이터를 불러올 때 'index_col'을 통해 지정하지 않았거나 데이터 가공 도중 임의의 인덱스(0,1,2, ... )로 지정되었을 경우 다시 인덱스를 지정할 필요가 있음


인덱스 1부터 시작하기

인덱스를 0이 아닌 1부터 시작하고 싶을 때는 df_name.index=df_name.index+1을 사용하면 됨


ex>  titanic.index=titanic.index + 1






ARIMA

시계열 데이터의 정상성 (Stationary)

- 전통적으로 시계열 분석은 현재 시점까지 시계열 데이터의 확률적 특성이 시간이 지나도 그대로 유지 될 것을 가정하고 있다. 즉 시간과 관계 없이 평균과 분산이 불변해야하고, 두 개의 시점 간의 공분산이 다른 시점 과는 무관해야 한다.

1. Constant μ (mean) for all t.
2. Constant σ (variance) for all t.
3. The autocovariance function between Xt1 and Xt2 only depends on the interval t1 and t2.



1) AR Model

Autoregressive 모델은 자기 회귀 모델이라고 불린다. 과거 시점의 자기 자신의 데이터가 현 시점의 자기 자신에게 영향을 미치는 모델이라는 뜻이다. AR(1)모델의 수식을 보면 아래와 같다. (AR의 차수 p=1 인 경우로 현재 시점부터 과거 p개 이전의 시점까지 데이터의 영향도를 보겠다는 뜻)

X(t) = w*X(t-1) + b + u*e(t)

위 수식을 보면 현재 시점 t에 대한 데이터는 이전 시점의 자기 데이터에 가중치 w를 곱하고 상수 b를 더하고(회귀식), error term인 e(t)에 가중치 u를 곱한 것을 더해서 표현할 수 있다. 여기서 e(t)는 white-noise라고 불리며, 일반적인 정규분포에서 도출된 random한 noise 값이다. 위에서 설명한 stationary와 관련된 것으로, 정상성 조건을 만족시키도록 하는 일종의 whitening이라고 하는 정규화로 보면 된다.

AR Model은 추세가 변하는 상황에서는 적합하지 않은 모델이다.


2) MA Model

Moving average 모델은 이동 평균 모델이라고 불리고, 트렌드 즉 추세가 변하는 상황에서 적합한 모델이다. MA(1) 모델을 수식으로 보면 아래와 같다. (MA의 차수 q=1인 경우로 과거 q개 이전의 변화율을 현재 시점에 반영하겠다는 뜻)

X(t) = w*e(t-1) + b +u*e(t)

위 수식을 보면 AR모델에서의 X(t-1)이 e(t-1)로 바뀌었다. 즉, 이전 상태의 자기자신을 보는 것이 아닌, 이전 항에서의 error텀을 현 시점에 반영하겠다는 뜻이다. 즉 변화율(추세)에 맞춰 추정하겠다는 의미다.


3) ARMA Model

ARMA는 1)의 AR과 2)의 MA모델을 합친 모델이다. 현재 시점의 상태를 파악하는 과거 시점의 자기 자신과 추세까지 전부 반영하겠다는 의미로, ARMA(1,1) 모델에 대한 수식을 보면 아래와 같이 간단하게 합칠 수 있다. (회귀 분석에서 독립 변수의 항이 늘어나는 개념)

 X(t) = w_{1,1}*X(t-1) + w_{2,1}*e(t-1) + b +u*e(t)


4) ARIMA Model

이제까지 AR, MA, ARMA모델의 경우 시계열이 정상성이라는 가정이 있는 상황에서 진행했다면, ARIMA모델에서는 차분이라는 개념을 통해 non-stationary한 상황에서 좀 더 나은 예측을 하는 것이 목표다. (현실세계의 데이터는 non-stationary한 경우가 대부분) 

따라서 ARMA모델에 차분이라는 차수 d가 포함되어 ARIMA(p,d,q)로 표현할 수 있다.

차분이라는 개념은 현재 상태에서 바로 이전 상태를 빼주는 것을 의미하며, 차분을 거친 결과들이 whitening되는 효과를 가져온다.

차분을 수식으로 보면 아래와 같다.

d = 0 : x_t = X_t

d = 1 : x_t = X_{t} - X_{t-1}

d = 2 : x_t = ( X_{t} - X_{t-1} ) - ( X{t-1} - X{t-2} )

결국 1차분이 필요한 ARIMA(1,1,1)모델의 경우 ARMA(1,1)모델의 수식에서 X위치에 1차분이 들어간 식을 대입해주면 된다.


- (p, d, q) 차수의 결정

 1) 차분 차수 d : 시계열 plot을 보고 정상성 여부를 확인하고, 차분을 진행하고, 차분 후의 plot을 보고 여부를 확인하는 프로세스로 진행한다. 

 

2) p, q : p, q의 경우 보통 ACF(Autocorrelation function)와, PACF(Partial Autocorrelation function)를 보고 결정한다. ACF는 k lag 단위로 구분된 시계열 관측치 Xt 와 Xtk 간의 상관 측도이고,  PACF는 다른 모든 짧은 시차 항에 따라 조정한 후 k 시간 단위로 구분된 시계열의 관측치 \(X_{t}\) 와 Xtk 간의 상관 측도 이다. (참고 : ACF. , PACF ) 

아래 표를 보면 ACF와 PACF plot의 형태에 따라 p와 q의 차수를 결정할 수 있다. (아래 예시를 통해 구체적으로 확인)

 ACFPACF
AR(p)ACF plot이 서서히 감소하는 형태PACF plot이 p lag 이후 절단되는 형태
MA(q)ACF plot이 q lag 이후 절단되는 형태 PACF plot이 서서히 감소하는 형태

2022년 6월 20일 월요일

Convolution 필터 작동 원리

Convolution 필터 작동 원리

CNN 합성곱 신경망 (Convolution Neural Network)

이미지 특징 추출에서는 크게 합성곱층(Convolution Layer)과 풀링층(Pooling Layer)으로 구성

이미지의 특징을 추출하고(Feature Learning), 이미지를 분류함(Classification)

영상객체 인식에서 우수한 성능을 보이는 신경망


이미지는 3차원 텐서 : 높이, 너비, 채널

3 color channels

채널이 1 : 흑백 이미지

채널이 3 : RGB 색상 이미지

Height : 4 Units(Pixels) 높이 : 이미지의 세로 방향 픽셀 수

Width : 4 Units(Pixels) 너비 : 이미지의 가로 방향 픽셀 수

각 픽셀은 0~255 사이의 값을 가짐


이미지와 필터

32(높이) x 32(너비) x 3(채널) 크기의 이미지에서 5(높이) x 5(너비) x 3(채널) 필터 사용

이미지 아웃 채널과 필터의 채널은 항상 같아야 함.

필터는 항상 입력 값의 전체 깊이를 확장하기 때문

Filters always extend the full depth of the input value.


필터 작동 원리

벡터의 내적을 계산하며 필터가 이미지를 슬라이딩하며 지나감

벡터의 내적

5(높이) x 5(너비) x 3(채널) = 75차원 벡터 내적 + 편향(Bias)





2022년 2월 25일 금요일

2022년 02월 25일 추천주 - 바디텍메드




바디텍메드 - 코스닥 206640

3월 초 16,500원 돌파 예상

강재의 인성(toughness)

 강재의 인성은 재료가 파괴되기까지 변형할 수 있는 능력을 말한다.

응력-변형률 곡선에서 하부 면적에 해당된다.

- 재료의 변형 에너지를 흡수할 수 있는 능력

- 인성이 우수할수록 외력에 대한 변형이 잘 일어남

- 재료의 응력-변형률 관계곡선에서 면적에 해당됨.


2022년 1월 10일 월요일

건축계획_0110

1. 상점 건축의 진열장 배치

손님 쪽에서 상품이 효과적으로 보이도록 계획한다.

들어오는 손님과 종업원의 시선은 직접 마주치지 않게 한다.

감시하기 쉬우면서 감시한다는 인상을 주지 않도록 한다.

동선이 원활하여 다수의 손님을 수용하되, 가능한 소수의 종업원으로 관리하게 한다.

손님의 동선은 길게 하고, 종업원 동선은 짧게 한다.


2. 도서관에 있어 모듈 계획(Module Plan)을 고려한 서고 계획 시 결정 및 선행되어야 할 요소

서가 선반의 배열 깊이

서고 내의 주요 통로 및 교차 통로의 폭

기둥의 크기와 방향에 따른 서가의 규모 및 배열의 길이


3. 호텔의 퍼블릭 스페이스(public space) 계획

로비는 개방성과 다른 공간과의 연계성이 중요하다.

프론트 데스크 후방에 프론트 오피스를 연속 시킨다.

주식당은 외래객이 편리하게 이용할 수 있도록 출입구를 별도로 설치한다.


4. 아파트에서 친교공간 형성을 위한 계획 방법

아파트에서의 통행을 공동 출입구로 집중시킨다.

별도의 계단실과 입구 주위에 집합단위를 만든다.

공동으로 이용되는 서비스 시설을 현관에서 인접하여 통행의 주된 흐름에 약간 벗어난 곳에 위치시킨다.


5. 건축양식




비잔틴 건축 - 도서렛(dosseret)과 펜던티브 돔(pendentive dome)


6. 오토 바그너(Otto Wagner)가 주장한 근대건축의 설계지침

경제적인 구조

시공재료의 적당한 선택

목적을 정확히 파악하고 완전히 충족시킬 것


7. 공동주택의 단면형식

메조넷형에서 통로가 없는 층은 채광 및 통풍 확보가 양호하다.

플랫형은 평면구성이 제약이 적으며, 소규모의 평면계획도 가능하다.

스킵 플로어형은 동일한 주거동에서 각기 다른 모양의 세대 배치가 가능하다.


8. 공연장의 객석 계획에서 잘 보이는 동시에 실제적으로 관객을 수용해야 하는 공연장에서 큰 무리가 없는 거리인 제1차 허용거리의 한도

1차 허용한도 : 22m

2차 허용한도 : 35m


9. 우리나라의 현존하는 목조건축물 중 가장 오래된 것

봉정사 극락전 : 고려시대 건축물, 가장 오래된 목조건축물

부석사 무량수전 : 고려시대 건축물, 주심포계 팔작지붕

수석사 대웅전 : 고려시대 건축물


10. 열람자가 서가에서 책을 자유롭게 선택하나 관원의 검열을 받고 열람하는 도서관 출납 시스템

폐가식 : 열람자가 책 목록을 통해서 책을 선택할 수 있고, 대출기록을 남긴 뒤 대출한다. 서고와 열람실이 분리되어 있다.

반개가식 : 서가에서 책 표지 정도를 열람할 수 있고, 관원에게 대출기록을 남긴 후에 열람이 가능하다.

안전개가식 : 열람자가 책을 직접 선택할 수 있고, 관원의 검열 및 대출기록을 남긴 뒤에 열람한다.

자유개가식 : 열람자가 직접 책을 꺼내서 검열받지 않고 책상에서 열람한다.


11. 테라스 하우스

각 호마다 전용의 뜰(정원)을 갖는다.

각 세대마다 개별적인 옥외 공간의 확보가 가능하다

진입 방식에 따라 하향식과 상향식으로 나눌 수 있다.

도로를 중심으로 상향식 하향식으로 구분할 수 있다.

시각적인 인공테라스형은 위층으로 갈수록 건물의 내부 면적이 작아지는 형태이다.

일반적으로 경사지를 이용하여 지형에 따라 건물을 축조한다.

일반적으로 후면에 창이 없으므로 각 세대의 깊이는 7.5M 이상으로 하면 안된다

경사가 심할수록 밀도가 높아진다.

평지보다 더 많은 인구를 수용할 수 있어 경제적이다.

연속주택

경사지에서 작절한 절토에 의하여 자연지형에 따라 건물을 테라스형으로 축조하는 것으로 각 호마다 전용의 뜰(정원)을 갖는다


12. 학교 교사의 배치 형식

분산 병렬형은 넓은 부지를 필요로 한다. 교실의 환경 조건이 균등

폐쇄형은 일조, 통풍 등 환경 조건이 불균등하다. 소음이 크다. 화재, 비상시 불리, ㄴ,ㅁ

분산 병렬형은 구조 계획이 간단하고 생활 환경이 좋아진다.

집합형은 이동 동선이 짧아지고, 물리적 환경이 좋다.


13. 사무소 건물의 엘리베이터 배치 시 고려 사항

교통동선의 중심에 설치하여 보행거리가 짧도록 배치한다.

대면배치에서 대면거리는 동일 군 관리의 경우 3.5~4.5m로 한다.

여러 대의 엘리베이터를 설치하는 경우, 그룹별 배치와 군 관리 운전방식으로 한다.

일렬 배치는 5대를 한도로 하고, 엘리베이터 중심 간 거리는 10m 이하가 되도록 한다.


14. 사무소 건축의 코어 형식 중 편심형 코어에 관한 설명

고층인 경우 구조상 불리할 수 있다.

각 층 바닥면적이 소규모인 경우에 사용된다.

바닥면적이 커지면 코어 이외에 피난시설 등이 필요해 진다.

중심형 코어 : 내진구조상 유리하며 구조코어로서 가장 바람직한 형식이다. 바닥면적이 클 경우에 적합하고, 고층 혹은 초고층 건물에 적합한 형태이다


15. 공장건축의 레이아웃

장래 공장 규모의 변화에 대응한 융통성이 있어야 한다.

제품중심의 레이아웃은 생산에 필요한 모든 공정, 기계기구를 제품의 흐름에 따라 배치한다.

레이아웃은 공장 생산성에 미치는 영향이 크므로 공장의 배치계획, 평면계획은 이것에 부합되는 건축계획이 되어야 한다.

재료, 조립 부품은 고정된 장소에 위치하고, 사람이나 기계가 이동하여 작업하는 방식을 고정식 레이아웃이라 한다.

제품이 크고 수가 적은 경우에 이 레이아웃을 적용할 수 있고, 선박이나 건축의 경우 이 레이아웃을 적용할 수 있다.


16. 병원건축에 있어서 파빌리온 타입(pavilion type)에 관한 설명

각 실의 채광을 균등히 할 수 있다.

평면 분산식으로 배치하고, 대지 이용의 효율성이 낮으며, 넓은 부지를 필요로 한다

집중식(block type)

대지 이용의 효율성이 높다.

고층 집약식 배치형식을 갖는다.

도심지에서 주로 적용되는 형식이다.


17. 전시 공간의 특수전시기법 중 하나의 사실이나 주제의 시간상황을 고정시켜 연출함으로써 현장에 임한 듯한 느낌을 가지고 관찰할 수 있는 기법

디오라마 전시

알코브 전시 : 알코브란 벽면을 오목하게 하여 만든 공간을 뜻한다.

아일랜드 전시 : 벽이나 천장 없이 전시물 및 전시장치로 배치한다.

하모니카 전시 : 전시 평면이 하모니카 흡입구 모양으로, 동일공간이 연속 배치되는 형태이다.

파노라마 전시 : 연속적인 주제를 선적으로 관계성 있게 표현할 수 있다.


18. 백화점 매장의 배치 유형

직각배치는 매장 면적의 이용률을 최대로 확보할 수 있다.

사행배치는 많은 고객이 매장공간의 코너까지 접근하기 용이한 유형이다.

사행배치는 Main 통로를 직각 배치하며, Sub 통로를 45°정도 경사지게 배치하는 유형이다.

직각배치는 통행량에 따른 폭 조절이 어렵다


19. 지속가능한(Sustaiable) 공동주택의 설계개념

환경친화적 설계

지형순응형 배치

가변적 구조체의 확대 적용


20. 래드번(Radburn) 계획의 5가지 기본원리

기능에 따른 4가지 종류의 도로 구분

자동차 통과도로 배제를 위한 슈퍼블록 구성

보도망 형성 및 보차분리 - 주도로와 보행로의 교차지저 입체화

Cul-de-sac형의 좁은 도로 구성

주택단지 어디로나 통할 수 있는 공동 오픈 스페이스 조성