객체의 실행과 전달되는 메소드의 처리과정을 살펴보기

이전에 올렸던 내용을 좀 더 떼어내서 살펴보겠습니다.
(원래는 메세지 전달에 대한 궁금증 뿐이었습니다만.. 이건 심화학습정도 되겠네요)

이 문제와 관련되어 메일링 리스트에서 왔다갔다한 내용은 다음과 같습니다

스몰토크는 메소드 단위로 컴파일됩니다. 웍스페이스에서 선택해서 DoIt을 한다고 해도
해당 텍스트를 마치 메소드인냥 컴파일한다음 실행합니다. 
실행하는 메소드는 ProtoObject>>withArg:excute: 인가 그렇고
두번째 인자가 컴파일된 메소드입니다. 컴파일 결과는 스택기반 가상기계용 바이트코드구요.
=============================================
그럼 좀 구체적으로 질문을 드려도 될까요?

Transcript show: 'a'가 compile된다면

ProtoObject withArg:'Transcript show: 'a''
이런식으로 된다는 의미인건가요?
compile이 끝나면 vm위의 메모리에 바이트코드 형태로 존재하게 될거라는건
예상이 되는데....
실제로 어떻게 동작되는지 조금 궁금합니다.
=============================================
Transcript show: 가 어떤식의 VM 머신코드로 컴파일 되는지는 다음처럼 해보면 알 수 있습니다.

"Transcript 가 ThreadSafeTranscript의 인스턴스이므로.."

(ThreadSafeTranscript >> #show:) symbolic. 
"print it 해보세요."

관련해서 더 자세한 내용은 다음 페이지를 참고해보면 도움이 되겠네요.

Introduction to Smalltalk bytecodes

어? 그럼 이떤식으로 메세지가 compile되는지도 알 수 있다는거여?
일단 까라면 까야하는법 PrintIt을 해봤습니다. 그랬더니…

'21 <70> self
22 <88> dup
23 <10> pushTemp: 0
24  send: print:
25 <87> pop
26  send: endEntry
27 <87> pop
28 <78> returnSelf
'

이런결과를 workspace에서 볼 수 있네요.
……………………………
뭔가 죽이는데요? 저 내용 자체가 Smalltalk VM에서 인식하는 수준의 lowlevel이라는건데…
또 다른 방법이 있는거같습니다.
이번에는 한주영님이 알려주신 내용을 보겠습니다.

Transcript show: 'a'를 선택해서 Debug it 해보시면
SmalltalkEditor 클래스의 다음 메소드에서 멈춰있습니다.

debug: aCompiledMethod receiver: anObject in: evalContext

여기, aCompiledMethod 가 UndefinedObject>>#DoIt 메소드이며
실제로는 CompiledMethod 인스턴스(CompiledMethod는 ByteArray를 상속)입니다.
아마 임시로 생성된 메소드라고 보시면 될것 같아요.
receiver(anObject)는 nil 입니다.

DoIt 메소드의 몸체가 바로 "Transcript show: 'a'"입니다.
DoIt 이라는 CompiledMethod는 다음과 같이 바이트코드를 가지고 있습니다.

25 <41> pushLit: Transcript
26 <22> pushConstant: 'a'
27  send: show:
28 <7C> returnTop

메모리 상에 35바이트를 차지하네요.

debug:receiver:in: 에서 다음과 같이 호출합니다.

   aCompiledMethod
                       valueWithReceiver: anObject
                       arguments: (evalContext ifNil: [ #() ] ifNotNil: [ { evalContext } ])

valueWithReceiver: aReceiver arguments: anArray
  ^ aReceiver withArgs: anArray executeMethod: self

aReceiver는 nil이지만 withArgs:executeMethod:를 호출하는데에는 아무 문제가 없죠 ^^

#Transcript 심볼을 푸시
'a' 상수를 푸시
#show: 심볼을 'send'
그리고 리턴이네요..

'send'를 처리하고나면 결과값이 stack top에 저장되어 있을 거고요.

실제 본인이 디버깅 해가면서 추적하는 방법을 통째로 알려주셨습니다.
사실 방법이야 여러가지가 있겠습니다만…
중요한건 실시간으로 컴파일되는 바이트코드를 결과물로 봐가면서 디버깅을 할 수 있고
그걸로 내부 구조를 좀 더 볼 수 있다는게 중요한거같네요.

아직 이 내용을 제대로 다 숙지하지는 못했습니다만…..
좀 더 코드를 두들겨보고 스스로 결론을 낼 수 있는 단계가 오면
최종과정으로 한번 더 글을 쓰도록 하겠습니다 😀

inject:into: 에 대해 조금 더 생각하기

inject:into:를 쓰는곳은 종종있는데 (배열 내부 element의 합을 구하는경우)
그게 어떤식으로 동작하는지에 대해 좀 자세히 쓰여진 내용이 없더군요.
그래서 대체 어떻게 돌아가는지 궁금해지기 시작했습니다.

일단 gnu smalltalk에서 제공되는 예제를 보겠습니다.
(출처 : http://en.wikipedia.org/wiki/GNU_Smalltalk)

#(1 3 5) inject: 10 into: [ :sum :element | sum + element ] "=> 19"

오호라… 이렇게 하니까 19가 나온대요..(물론 printIt으로 보는거라는건 알고 계시겠죠 다들?)

………..
………………..
야.. 내부를 더한다매 왜 19야?
그렇죠.. 10+1+3+5의 결과니깐 저렇게 19가 되는겁니다.
대체 어떤 순서로 동작하길래 저런결과가 나오는걸까요?
그래서 step별로 각 변수의 value를 추적해보면 다음과같은 결과를 얻을 수 있습니다.

1step. sum=10, element=1
2step. sum=11, element=3
3step. sum=14, element=5

오호…. 이것봐라? 기본적으로 inject에 있는 10을 기본값으로 잡고 a=a+b의 식으로 연산을 하고있군요.
그럼 첫째 변수가 inject초기값 그리고 덧셈의 결과값을 항상 가지고있게되고 둘째변수는 배열의 순번에 따라
차례대로 배열 내의 element의 값을 가져오게 되는거같습니다.
(………..사실 변수이름을 생각해보면 간단한거였는데…. 역시 바보는 어쩔수없…-.-)

그럼 대체 어떻가 값을 trace하는가?
승범님이 알려주신대로의 문장을 적어보면 다음과같은 형식이 됩니다.

#(1 3 5) inject: 5 into: [ :sum :element | Transcript show: sum; cr. sum + element ]

이야.. 블록식 안쪽에 바로 넣어버리네요… 사실 저는 printf를 쓰는거라면 익숙합니다만..
어떻게 해야할지 감을 못잡았는데…
(알려주신 승범님 감사합니다)
블록식 안쪽이 연산식이라고 생각하면 당연히 성립했어야 하는건데 생각을 제대로 못했네요.
이런방법으로 블록식 안쪽의 변수값을 step마다 trace해서 Transcript에 찍을 수 있습니다.
물론 sum 외의 i 값도 당연히 trace를 할 수 있겠죠.

이미 짐작하신분이 있다시피 이 경우는 element라는 변수가 Iterator로서의 역할을 하게되는거라고
생각해주시면 되겠습니다. 😀

Smalltalk에서의 Collection

http://trans.onionmixer.net/mediawiki/index.php?title=SqueakByExample:3.6

이 내용을 보면 Collection에 대한 부분이 나오게 됩니다.
사실 중요한건 Collection이 아니라 collection이 가지고 있는 성질에 대한 부분인데요..
번역문에 내용을 추가할까 하다가.. 이건 아니다싶어 따로 blog에 정리를 하도록 하겠습니다.

Smalltalk에서의 Collection이라는것은 일반적으로 STL에 많이 비교가 되더군요.
중요한건 C++에서의 STL은 “자료를 다루기위한 표준라이브러리” 라는겁니다.

C++ 표준 템플릿 라이브러리, 즉 STL은 C++프로그래밍에서 최상의 성능을 얻어내는 것,
그리고 서로 다른 자료구조와 알고리즘을 결합하기 위해 설계되었습니다.

참고URL::http://t3ddy.tistory.com/15

Smalltalk에서의 Collection을 이런 STL같은거다..라는 개념적인 비교가 아니라
여기서 주요하게 비교되는점인 Iterator에 대해 좀 더 알아보도록 하겠습니다.

사실 C++에서 STL의 장점은 Iterator(반복처리자)를 통한 데이터의 탐색 및 조작에 있습니다.

C++에서 Iterator를 통한 데이터의 처리에 대한 간단한 예를 보겠습니다.
예제출처::http://printf.egloos.com/1992692

#include 
#include 
using namespace std;

void main( )
{
    vector v;

    v.push_back(10);
    v.push_back(20);
    v.push_back(30);

    vector::iterator iter;
    for(iter = v.begin() ; iter != v.end() ; iter++)
        cout < < *iter << endl;

    iter = v.begin()+2;
    cout << *iter << endl;
}

위의 예제에서 vector라는 템플릿으로 v를 선언했고 값을 넣었습니다. 그리고 생성된 v 라는 인스턴스에 값들을 집어넣게되죠.
(물론 vector는 int형으로 선언되었기때문에 v에 넣을 수 있는값은 int입니다)
그리고 vector의 Iterator타입으로 iter라는 변수를 선언합니다.
이후 iter를 통해서 v라는 int-vector타입의 인스턴스의 데이터를 탐색합니다. 그리고 값을 출력하죠.

이렇게 Iterator는 탐색이 가능한 데이터집합의 포인터로서 사용될 수 있습니다.

굳이 비교를 하자면 php에서 database에 질의를 하고 그 결과를 변수에 받은다음 data를 seek하는데 이것도 일종의 Iterator라고 할 수 있겠죠.
(정확한 설명은 아닐 수 있겠습니다만.. 개념적으로는 맞지 않을까 합니다)

Smalltalk에서 Collection은 이러한 Iterator를 사용해서 Collection안의 데이터를 다루기 쉽게 해준다는데 있습니다.
맨위의 URL에 있는 예제를 아래에 옮겨서 보도록 하죠.

result := String new.
(1 to: 10) do: [:n | result := result, n printString, ' '].
(1 to: 10) collect: [ :each | each * each ]

이 2개의 예제를 보면 :n 그리고 :each가 Iterator인걸 알 수 있습니다.

첫번째 예제에서 do:라는 셀렉터에 [ ] 으로 묶여있는 블록식 안에서 :n은 n이라는 1 에서 10까지의 증가되고있는 현재값을 취급합니다.
1에서 10까지의 현재의 pointer가 되겠네요.

마찬가지로 두번째의 예제에서는 1에서 10까지의 증가되는값중 현재값을 :each가 받아서 데이터의 포인터로 사용하고 있습니다.

이렇게 Iterator는 현재 다루고있는 어떤타입의 배열에서도 데이터의 포인터값으로 사용될 수 있습니다.

실제로 Object Browser에서 Collections>Collection 을 보면 Collection을 상속받은
Array, FloatArray, Matrix, String, WordArray등을 찾을수가 있는데
이는 Smalltalk에서 사용되는 대부분의 배열은 Collection에서 지원하는 Iterator를 쓸 수 있다는것을 의미합니다.

한마디로 간단하게 설명되기는 애매해서 별도로 설명을 좀 길게 늘였지만
이것으로 제대로된 설명이 되는지는 모르겠습니다......-.-;